Estatistica Descritiva Texto

Estatística Descritiva
O objectivo da Estatística Descritiva é o de representar de uma forma concisa, sintética

e compreensível, a informação contida num conjunto de dados. Esta tarefa, que adquire
grande importância quando o volume de dados for grande, concretiza-se na elaboração
de tabelas e de gráficos, e no cálculo de medidas ou indicadores que representam
convenientemente a informação contida nos dados.
Exemplo:
Uma exploração pecuária tem os registos de produção diária de uma manada de várias
vacas, ao longo de diversas épocas de lactação. Na situação mais simples, em que existe
apenas 1 vaca durante uma época de lactação, existem pelo menos 300 registos de
produção diária. Este conjunto de dados aumenta extraordinariamente com o número de
vacas e os anos de registos. O técnico pouca informação útil consegue retirar, no sentido
de ficar a conhecer o comportamento da produção diária de leite, pela leitura da
listagem completa de todos os dados. Provavelmente, o resumo dessa listagem de
valores, em forma de tabelas, gráficos e pelo cálculo de alguns indicadores ou
parâmetros estatísticos, consegue transmitir maior quantidade da informação contida
nesse conjunto de dados.
O conjunto de dados, por maior que seja, raramente corresponde à totalidade da

população de indivíduos em análise, mas será apenas uma amostra dessa população.
Os dados em análise são os registos de observações de características em indivíduos (ou

elementos) sobre os quais recai a análise. Os dados podem ser de natureza qualitativa, se
expressam características medidas ou avaliadas numa escala nominal (os dados são
classificados por categorias não ordenadas) ou numa escala ordinal (os dados são
classificados por categorias ordenadas); ou podem ser de natureza quantitativa, quando
são expressos numa escala numérica absoluta (que pode ser de natureza discreta ou
contínua), ou então numa escala numérica intervalar (escala cuja origem é arbitrária).
Cada uma das características constitui uma variável aleatória (da natureza dos dados que
contém). As análises de dados podem referir-se a uma única variável – estatística
univariada – ou a diversas variáveis, incluindo a análise de relações entre essas variáveis
– estatística multivariada.
Designa-se por população (ou universo) o conjunto de dados que expressam a

característica em causa para todos os indivíduos, elementos ou objectos sobre os quais a
análise incide. A maior parte das populações têm um tamanho infinito, ou o tamanho,
embora finito, é de tal modo grande que na prática se considera como infinito, de modo
que é virtual e praticamente impossível analisar todos os indivíduos de uma população.
De um modo geral, os estudos incidem sobre um ou mais subconjuntos de dados (isto é,
amostras) retirados da população.
Geralmente o tamanho (isto é, o número de elementos) da amostra é muito reduzido,

comparativamente ao tamanho da população de onde se retira a amostra.
As principais razões para que as análises estatísticas sejam efectuadas sobre amostras, e
não sobre todos os indivíduos da população são:
ESA 2005/2006 1
• A população é infinita, ou considerada como tal, não podendo portanto ser

analisada na íntegra;
• Custo excessivo do processo de recolha e tratamento dos dados, como resultado
da grande dimensão da população ou da complexidade do processo de
caracterização de todos os elementos da população;
• Tempo excessivo do processo de recolha e tratamento dos dados, conduzindo à
obtenção de informação desactualizada;
• As populações são dinâmicas, de onde resulta que os elementos ou objectos da
população estão em constante renovação, de onde resulta a impossibilidade de
analisar todos os elementos desta população;
• Recolha de informação através de processos destrutivos (que, se aplicada
exaustivamente, conduziria à completa destruição da população);
• Inacessibilidade a alguns elementos da população, por diversas causas.
A título de exemplo, considerem-se os seguintes universos estatísticos, e tente-se

perceber a razão da impossibilidade de analisar todos os seus elementos:
• Caracterização das intenções de voto de uma população eleitora constituída por

vários milhões de eleitores;
• Caracterização geológica do subsolo;
• Caracterização das características inflamatórias numa linha de fabrico de
fósforos;
• Caracterização dos saldos médios das contas bancárias de todos os médicos
portugueses;
• Análise organoléptica do conteúdo das garrafas numa linha de engarrafamento
de cerveja.
O processo de selecção de uma amostra a partir de uma população designa-se por

amostragem. Para que as análises estatísticas efectuadas sobre a amostra sejam
representativas, e possam ser generalizadas a toda a população (capítulo da Estatística
designado por Inferência Estatística), a amostra deve ser efectuada de acordo com um
processo de amostragem probabilística, de tal modo que cada um dos elementos da
população tenha hipóteses de ser incluído na amostra, sendo possível quantificar a
probabilidade de tal suceder.
De todos os processos de amostragem probabilística, o mais importante é o de

amostragem aleatória, que garante que todos os elementos da população têm as mesmas
hipóteses de serem integrados na amostra. Através deste método de amostragem, evita-
se o enviesamento da selecção, isto é, elimina-se ou reduz-se a tendência sistemática
para sub-representar ou sobre representar na amostra alguns elementos da população.
Existem outros métodos de amostragem probabilística, como seja a amostragem

estratificada, em que a população é dividida em estratos, e cada um destes estratos
contribui com uma parcela (geralmente não igual para todos os estratos) para a
formação da amostra. Se estes estratos não forem estabelecidos com rigor, estes
métodos de amostragem podem conduzir a fortes enviesamentos da amostra.
Seguidamente exemplificam-se alguns possíveis tipos de enviesamento que podem

ocorrer nas amostras.
ESA 2005/2006 2
População: intenções de voto dos eleitores de uma cidade.

Amostra: intenções de voto de um grupo de eleitores seleccionados ao acaso a partir da
lista telefónica da cidade.
Enviesamento de selecção: (1) sub-representação das intenções de voto dos eleitores
pertencentes aos estratos económicos mais baixos, que não têm telefone.
Enviesamento de selecção: (2) sobrerepresentação de alguns estratos sociais (idosos,
desempregados, etc) se, por acaso, a recolha de dados for efectuada durante o horário
laboral, durante o qual as pessoas não estão nas residências (normalmente nesses
horários é mais frequente encontrar em casa as pessoas dos estratos sociais referidos
atrás).
População: incidência da mosca da azeitona nos olivais de uma zona agrícola.

Amostra: incidência da mosca da azeitona na amostra de azeitonas recolhidas em
diversas árvores seleccionadas ao acaso nessa zona.
Enviesamento de selecção: sobrerrepresentação dos frutos das camadas mais baixas e
exteriores das copas das oliveiras.
População: diâmetros das árvores de um povoamento de pinheiro bravo.

Amostra: diâmetros das árvores circunscritas em circunferências de 10 m de diâmetro
marcadas no campo.
Enviesamento de selecção: sub-representação das árvores localizadas nos locais mais
inacessíveis.
População: pesos médios de coelho bravo numa zona de caça.

Amostra: pesos médios dos coelhos capturados em várias armadilhas colocadas
mediante algum critério de distribuição na zona em estudo.
Enviesamento de selecção: sobrerrepresentação dos exemplares mais frágeis, que por
natureza, mais facilmente caem nas armadilhas.
A recolha de dados pode ser realizada recorrendo a processos que se podem classificar
em experimentais ou observacionais.
Nos processos experimentais exerce-se um controle directo sobre os factores que

potencialmente afectam a característica ou o conjunto de características em análise. O
objectivo é, geralmente, o de pôr em evidência a influência exercida por aqueles
factores, isolada ou conjuntamente. A fase de preparação e condução do processo
experimental de recolha de dados designa-se por delineamento experimental.
Nos processos observacionais, os factores que potencialmente afectam a característica

ou o conjunto de características em análise não são controlados. Os procedimentos que
mais frequentemente são utilizados na aquisição de dados são a observação (exame
directo e registo das características observadas nos elementos da amostra) e o
questionário (sondagens, seja por entrevista directa ou por telefone, seja através de
questionários respondidos em algum suporte – papel, disquete, e-mail, formulários em
páginas web, etc).
ESTATÍSTICA DESCRITIVA
ESA 2005/2006 3
Caracterização de amostras univariadas
Uma amostra diz-se univariada quando os dados que a integram se referem apenas a um
atributo ou característica dos elementos.
Dados qualitativos
As formas mais comuns de descrever amostras univariadas com dados expressos em

escala nominal ou ordinal envolvem o recurso a tabelas de frequências, diagramas de
barras ou diagramas de sectores ou circulares. Em qualquer dos casos, o objectivo é o de
representar a forma como os dados se distribuem por um conjunto de diferentes
categorias.
Designa-se por frequência absoluta da categoria i o número de dados contidos na

i.ésima categoria das k categorias consideradas, e representa-se geralmente por ni .
Admitindo que as categorias especificadas contêm todos os dados, o número total de
dados da amostra é:
k
N = ∑ ni
i =1
Se expressamos o número de dados da i.ésima categoria em termos de proporção do

número total de dados da amostra, temos a frequência relativa da i.ésima categoria:
ni
fi =
N
As frequências relativas são muitas vezes definidas em termos percentuais:
ni
fi = × 100
N
Exemplo:
Um rebanho de 150 ovelhas foi analisado relativamente à característica “número de

borregos nascidos numa época de parição”. Observou-se que existiam 4 categorias de
ovelhas neste rebanho:
categoria 0: ovelhas não paridas (isto é, 0 borregos nascidos por ovelha);

categoria 1: ovelhas com parto simples (isto é, 1 borrego nascido por ovelha);
categoria 2: ovelhas com parto duplo (isto é, 2 borregos nascidos por ovelha);
categoria 3: ovelhas com parto triplo (isto é, 3 borregos nascidos por ovelha).
A seguinte tabela de frequências resume o número de ovelhas (frequência absoluta) e a

frequência relativa de ovelhas em cada uma das 4 categorias:
ESA 2005/2006 4
Categoria Frequência absoluta Frequência relativa (%)

ni fi
Não paridas 18 12
Parto simples 102 68
Parto duplo 24 16
Parto triplo 6 4
TOTAL 150 100
Esta tabela de frequências pode representar-se graficamente, num gráfico de barras, em

que no eixo das abcissas se identificam as diversas categorias em que se dividiu a
amostra, e em que o eixo das ordenadas representa uma escala, que pode ser
proporcional às frequências absolutas, ou à das frequências relativas, das categorias; em
cada uma das categorias é desenhada uma barra cuja altura será igual à da frequência
absoluta (ou relativa, consoante a escala usada):
Diagrama de barras das frequências absolutas:
120
102
100
Freq. Absoluta
80
60
40
24
18
20
6
0
Não paridas Parto simples Parto duplo Parto triplo
Tipo de parto
Diagrama de barras das frequências relativas:
80
70
Freq. relativa (%)
60
50
40
30
20
10
0
Não paridas Parto simples Parto duplo Parto triplo
Tipo de parto
ESA 2005/2006 5
Note-se que, seja o gráfico elaborado na escala de frequências absolutas ou de

frequências relativas, o aspecto é o mesmo, já que a escala das frequências relativas é
uma transformação linear da escala das frequências absolutas.
O gráfico de sectores, mais difícil de elaborar manualmente, divide a área do círculo

(que representa a totalidade da amostra) em tantos sectores quantas as categorias, sendo
a área de cada um destes sectores proporcional à frequência absoluta (ou à frequência
relativa) da respectiva categoria:
Parto triplo
4% Não paridas
12%
Parto duplo
16%
Parto simples
68%
Dados quantitativos
De uma maneira geral, a análise de amostras de dados quantitativos pode incluir o

resumo dos dados em tabelas de frequências, representações gráficas (sendo as mais
usuais os histogramas, polígonos de frequências, diagrama de pontos, diagrama de
caule-e-folhas, diagrama de extremos-e-quartis), e a estimativa de parâmetros ou
indicadores estatísticos (também designados pela expressão “estatísticas”).
Amostras de pequena dimensão, com dados não agrupados em classes
Nas secções seguintes vamos usar, para além de outros exemplos esporádicos usados
para ilustrar as explicações de alguns conceitos, a seguinte amostra de pesos (em kg) à
nascença de borregos (pressuposta aleatória e representativa do rebanho):
4.2 2.8 3.2 3.0 3.8 3.2 4.0 3.6

2.2 3.2 2.1 3.4 2.4 2.2 2.4
O tamanho da amostra é N = 15 observações.
Quando as amostras são de pequenas dimensões, pode dispensar-se a elaboração de

tabelas de frequências, pois observa-se que, de um modo geral, é pouco frequente
existirem dados repetidos, donde resulta que a maior parte das frequências absolutas
para os diferentes valores da variável aleatória xi (vamos considerar genericamente a
variável aleatória X ) são ni = 1 . Contudo, pode organizar-se uma tabela de cálculo,
ESA 2005/2006 6
tomando por base a tabela de frequências, que auxiliará na realização dos cálculos
subjacentes à estimação dos parâmetros estatísticos. Na secção do cálculo destes
parâmetros apresentar-se-á esta tabela.
Pelas mesmas razões também é pouco usual traçar-se o histograma (nome dado ao
gráfico de barras para a situação em que nas abcissas se representam os diversos valores
possíveis xi da variável aleatória), já que maioria das barras (no caso de valores
discretos, ou analisados como tal, as barras têm largura nula, reduzindo-se a uma linha
vertical) que representam as frequências absolutas têm altura unitária.
Aliás, refira-se que a elaboração do histograma em pequenas amostras pode ocasionar

interpretações desajustadas, nomeadamente no que se refere à simetria da amostra.
Vejamos o seguinte exemplo, em que a amostra foi pressupostamente retirada de uma
população com distribuição normal:
3
Freq. Asoluta
0
15 16 17 18 19 20 21 22
xi
Repare-se que a análise do gráfico pode induzir à conclusão de que a amostra é

assimétrica, o que contraria o pressuposto enunciado da normalidade da população de
onde a amostra foi retirada.
Para a amostra de borregos em análise, a tabela de frequências e o histograma têm o

n
seguinte aspecto, onde fi = i é a frequência relativa da observação xi , e Fac, fra são
N
as frequências absolutas acumuladas e as frequências relativas acumuladas:
xi ni Fac fi fra
2.1 1 1 0.0667 0.0667
2.2 2 3 0.1333 0.2000
2.3 0 3 0 0.2000
2.4 2 5 0.1333 0.3333
2.5 0 5 0 0.3333
2.6 0 5 0 0.3333
2.7 0 5 0 0.3333
2.8 1 6 0.0667 0.4000
2.9 0 6 0 0.4000
3 1 7 0.0667 0.4667
3.1 0 7 0 0.4667
ESA 2005/2006 7
3.2 3 10 0.2000 0.6667

3.3 0 10 0 0.6667
3.4 1 11 0.0667 0.7333
3.5 0 11 0 0.7333
3.6 1 12 0.0667 0.8000
3.7 0 12 0 0.8000
3.8 1 13 0.0667 0.8667
3.9 0 13 0 0.8667
4 1 14 0.0667 0.9333
4.1 0 14 0 0.9333
4.2 1 15 0.0667 1.0000
N = ∑ ni = 15 ∑f i =1
Histograma
4
Freq. Absolutas
0
2,1
2,3
2,5
2,7
2,9
3,1
3,3
3,5
3,7
3,9
4,1
x
Conforme referido anteriormente, devido ao reduzido tamanho da amostra, a tabela de

frequências e o histograma são pouco informativos, pois existem diversos “vazios” no
interior, que poderiam sugerir a discretização da amostra, quando a população é
tipicamente de natureza contínua; além disso, não dão informação nítida acerca da
tendência central, da dispersão e da simetria da amostra.
Representações gráficas mais usuais para pequenas amostras com dados não agrupados
em classes
Diagrama de pontos (“dotplot”)
Representa cada um dos dados da amostra como um ponto, sobre um eixo horizontal,
onde é imposta uma escala numérica adequada aos dados da amostra. Se existem
diversos valores repetidos, sobre a mesma posição da escala são representados tantos
pontos quantos os valores repetidos:
ESA 2005/2006 8
Este tipo de gráfico é útil para analisar a distribuição dos valores no intervalo de
variação, permitindo evidenciar de um modo simples, situações de lacunas (isto é, não
ocorrências de observações) dentro do intervalo de variação, zonas de mais intensa
concentração de valores e situações de assimetria da distribuição. Os valores extremos
são facilmente identificados. Este tipo de gráfico é útil para pequenas amostras (até
cerca de 20 dados), porém resultar de leitura mais difícil para amostras maiores.
Para a amostra de borregos em análise, o diagrama de pontos tem o seguinte aspecto:
O aspecto informativo mais notório neste exemplo é o facto de destacar mais

nitidamente (que o histograma) o grupo de borregos com pesos da ordem de 2.1-2.4 kg,
podendo sugerir que estes dados possam ser considerados como valores extremos, ou
inclusivamente “outliers”.
Diagrama de caule-e-folhas (“stem-and-leaf”)
Este tipo de representação gráfica é uma maneira simples e engenhosa de apresentar os

dados num diagrama muito próximo do histograma, que realça a distribuição de
frequências dos dados, bem como as zonas do intervalo de variação com maior
concentração e as zonas com ausência de dados, bem como identifica a localização da
mediana da amostra. Permite igualmente destacar a existência de valores extremos na
amostra.
Inicialmente este tipo de diagrama foi idealizado para representar valores numéricos
com, pelo menos, dois dígitos. Contudo, as aplicações informáticas actuais
generalizaram o seu uso para valores inteiros com um só dígito.
Para construir um diagrama de caule-e-folhas:

i - começa por se ordenar a amostra por ordem crescente;
ii -de seguida, cada um dos dados é dividido em duas partes: “caule”, que é constituído
pelos primeiros dígitos do valor numérico, e “folha”, que é o último algarismo de cada
valor.
iii – Escrevem-se numa coluna as partes denominadas “caule”; quando há mais que uma
ocorrência do mesmo “caule”, este escreve-se uma única vez;
iv – à direita do “caule” escrevem-se as diversas ocorrências das partes “folha”.
Notas:
1 – Se os valores numéricos têm um único dígito, normalmente usa-se o algarismo zero

para representar as “folhas”;
2 – As aplicações informáticas que elaboram este tipo de representação apresentam à
esquerda uma coluna onde é registada a frequência absoluta acumulada até metade da
amostra, até ao “caule” onde se atingem 50% da amostra; para os restantes valores,
ESA 2005/2006 9
aparece a frequência absoluta acumulada em modo inverso, isto é, desde metade da

amostra até à frequência correspondente ao último caule.
3 – Se existe um “caule” onde se atinge metade da amostra (mediana), a frequência
absoluta desta classe é denotada entre parêntesis.
Exemplo:
Consideremos a seguinte amostra de valores de uma variável aleatória X genérica:
6.1 5.8 7.8 7.1 7.2 9.2 6.6 8.3 7.0 8.3
7.8 8.1 7.4 8.5 8.9 9.8 9.7 14.1 12.6 11.2
O diagrama de caule-e-folhas, elaborado numa aplicação estatística (MINITAB) é o

seguinte:
Por exemplo, existe um único valor no intervalo [5, 6[, que é o valor 5.8: o algarismo 5
representa o “caule” e o algarismo 6 representa a “folha” desta observação. No intervalo
[6, 7[ existem duas observações: 6.1 e 6.6; o “caule” é o algarismo 6, que se representa
uma única vez; as “folhas”, respectivamente os algarismos 1 e 6, aparecem indicadas de
seguida. Não existe nenhuma observação no intervalo [10, 11[; assim, aparece o
“caule”, mas não aparece nenhuma “folha”, sendo este “vazio” de dados facilmente
identificado. A mesma observação se faz para o intervalo [13, 14[. Note-se que para
valores com 3 (ou mais) dígitos, todos os algarismos à excepção do último são
atribuídos ao “caule”.
À esquerda é apresentada uma coluna com as frequências absolutas acumuladas. A

mediana ocorre num valor da classe 8, já que neste “caule” se atinge 50% da amostra:
existem 9 observações inferiores a 8, que conjuntamente com as 5 observações da classe
8 atingem e ultrapassam metade da amostra. Por esta razão, a frequência absoluta deste
“caule” é representado entre parêntesis. Note-se que para as restantes classes (ou
“caules”), as frequências absolutas aparecem acumuladas em ordem inversa.
Quando o intervalo de variação da amostra é muito estreito, por exemplo no exemplo

seguinte em que todos os valores pertencem ao intervalo [10, 11[, no mesmo “caule”
podem ser reunidos não apenas os valores com a mesma “folha”, mas sim dois grupos
de valores com “folhas” distintas; no exemplo seguinte, existem 5 “caules” para os
ESA 2005/2006 10
valores [10,11[: 10.0 e 10.1; 10.2 e 10.3; 10.4 e 10.5; 10.6 e 10.7; 10.8 e 10.9; o mesmo
se passa para os valores [11,12[:
10.0 11.1 11.4 10.5 10.6 10.7 10.6 10.5 10.3 11.0
11.7 11.6 10.2 10.1 10.6 10.4 10.8 10.9 11.3 11.8
Nota: alguns programas informáticos, para amostras do género desta última, utilizam a
notação “*” ou “z” – de zero - para os valores 10.0 e 10.1; “t” – de two e three
para 10.2 e 10.3; “f” – de four e five – para 10.4 e 10.5; “s” – de six e seven –
para 10.6 e 10.7; “.” ou “e” – de eight – para 10.8 e 10.9. O diagrama seguinte,
elaborado no programa estatístico NCSS, ilustra este pormenor:
Para a amostra de borregos em análise temos o seguinte diagrama de caule-e-folhas:
ESA 2005/2006 11
Tal como no diagrama de pontos, o grupo de borregos com pesos entre 2.2 e 2.4
aparecem isolados; além disso, ficamos a saber que a mediana é Med = 3.2 .
Parâmetros estatísticos
Na análise de dados numéricos usam-se determinados indicadores estatísticos que

descrevem o comportamento geral da amostra, em termos de localização (parâmetros ou
estatísticas de localização ou de tendência central) e em termos de dispersão dos valores
relativamente aos parâmetros de localização (parâmetros ou estatísticas de dispersão).
Parâmetros de localização
Moda
É o valor mais frequente (com maior frequência absoluta ou relativa) na amostra.
Conforme anteriormente referido, em pequenas amostras não é muito usual elaborar a

tabela de frequências, pois face ao pequeno número de valores, facilmente se consegue
ter a noção dos valores mais frequentes. Se, contudo, a dimensão da amostra assim o
justificar, pode elaborar-se a uma tabela de cálculo, que auxiliará na identificação dos
valores mais frequentes, além de que poderá usar-se como tabela de cálculo para
efectuar os cálculos dos parâmetros estatísticos.
Da tabela de frequências apresentada anteriormente para a amostra de borregos em

análise, facilmente se deduz que a moda é o valor Mod = 3.2 . Repare-se que a moda
também poderia ter sido deduzida do diagrama de caule-e-folhas e também do diagrama
de pontos.
Notas:
i – Em pequenas amostras, a moda pode ser pouco informativa acerca da tendência
central, pois a repetição de um valor pode ser meramente casual;
ESA 2005/2006 12
ii – No exemplo dos borregos, consideremos que o 1º valor era 2.2 (e não 2.1), de modo
que haveria também 3 observações de peso 2.2; isto é, a amostra teria duas modas, e
amostra dir-se-ia bi-modal;
iii – Os principais inconvenientes apontados à moda como parâmetro de localização, é o
facto de não ter um valor único, em amostras com mais de uma moda, além de que no
seu cálculo não se entra em conta com todos os valores da amostra;
iv – Alguns autores consideram que se existem 2 modas contíguas, a moda é a média
desses dois valores. Por exemplo, se no exemplo anterior, existissem 3 observações 3.1
e 3 observações 3.2, a moda seria 3.15.
Mediana
A mediana é definida como sendo o valor central de uma amostra de dados, ordenada
por ordem crescente ( xi , i = 1, 2,..., N ).
Se o tamanho de amostra é ímpar, existe um valor central, isto é, a mediana é o valor

Med = x N +1 .
2
Se o tamanho da amostra é par, não existe propriamente um valor, mas sim dois valores
centrais; nesta situação, considera-se que a mediana é a média das duas observações
x N + x N +1
centrais: Med = 2 2
.
2
Podemos usar a seguinte tabela de cálculo (sem a inclusão dos valores “vazios”) para
obter o valor da mediana (esta tabela será continuada nas secções seguintes como uma
ferramenta de cálculo dos parâmetros estatísticos):
xi ni Fac = ∑ ni
2.1 1 1
2.2 2 3
2.4 2 5
2.8 1 6
3.0 1 7
3.2 3 10
3.4 1 11
3.6 1 12
3.8 1 13
4.0 1 14
4.2 1 15
Temos uma amostra com N = 15 observações, donde a mediana será o valor x8 . Da

tabela anterior deduz-se que x7 = 3.0, x8 = x9 = x10 = 3.2 , isto é, a mediana é Med = 3.2 .
Nota: imagine-se que na amostra anterior havia duas observações 4.2, isto é, N =16;
x N + x N +1 x + x 3.2 + 3.2
nesta situação, a mediana seria Med = 2 2
= 8 9 = = 3.2
2 2 2
ESA 2005/2006 13
A grande vantagem da utilização da mediana como parâmetro de localização, reside no

facto de a mediana não é afectada pelos valores extremos da amostra, o que acontece
com a média.
A mediana é um importante parâmetro estatístico na análise e interpretação da simetria

da amostra.
O parâmetro mediana tem particular interesse na Estatística não Paramétrica, onde

muitos dos testes estatísticos são conduzidos em termos de mediana.
Média
A média aritmética amostral, ou média amostral, é o parâmetro de localização mais

utilizado, e constitui a estimativa do valor médio ou esperança matemática da
população.
A média é, teoricamente, o valor que todas as observações teriam se fossem todas

iguais, isto é, se não houvesse qualquer variabilidade dentro da amostra, situação esta
que não ocorre na prática, já que qualquer fenómeno natural tem sempre variabilidade
associada.
A média é calculada por:
∑x i
x= i =1
Se existem k < N distintos valores na amostra, tal que existem valores repetidos, sendo
k
ni a frequência absoluta do valor xi , tal que ∑ni =1
i = N , então a média é calculada por:
∑ n .x i i
x= i =1
Nota: para ter a noção da similaridade entre esta expressão e a anterior, basta imaginar
que todos os ni = 1 .
Para melhor se entender o conceito de média como medida de posição central,

pensemos numa barra horizontal, com uma escala correspondente às dimensões das
observações, em equilíbrio sobre um ponto fulcral, à semelhança de uma balança. Por
cada observação da amostra de dados, coloca-se um peso de 1 kg à distância
correspondente ao valor da observação. Nestas condições, o único ponto fulcral que
mantém a barra em equilíbrio horizontal é o ponto correspondente à média:
ESA 2005/2006 14
A vantagem da média, relativamente à mediana e à moda, é que o seu cálculo envolve

todos os valores da amostra. Porém, este facto pode ter o inconveniente de em amostras
com valores extremos muito acentuados, a média resultar afectada pela presença desses
valores.
As propriedades fundamentais da média são:
i- a soma de todos os desvios das observações para a média é nula, isto é:
∑(x − x ) = 0
i =1
i
ii - a soma de todos os quadrados dos desvios das observações para uma

constante λ é mínima quando essa constante é a média, isto é:
∑(x − λ)
2
i é mínima para λ = x
i =1
Se a amostra é muito pequena (digamos, N < 10 ), esta expressão é facilmente

calculável sem apoio de uma tabela de cálculo. Porém, para mais valores, é útil usar a
seguinte tabela como ferramenta de cálculo:
xi ni Fac = ∑ ni ni .xi
2.1 1 1 2.1
2.2 2 3 4.4
2.4 2 5 4.8
2.8 1 6 2.8
3.0 1 7 3.0
3.2 3 10 9.6
3.4 1 11 3.4
3.6 1 12 3.6
3.8 1 13 3.8
4.0 1 14 4.0
4.2 1 15 4.2
11
∑ n .x
i =1
i i =45.7
∑ n .x i i
45.7
Logo, a média é x = i =1
= = 3.0467
N 15
ESA 2005/2006 15
∑ n .x i i
ni .xi k ni
k k
n
Nota: x = i =1
=∑ =∑ .xi =∑ fi .xi , em que fi = i é a frequência relativa
N i =1 N i =1 N i =1 N
da observação xi . Isto é:
xi fi fi .xi
2.1 0.0667 0.1400
2.2 0.1333 0.2933
2.4 0.1333 0.3200
2.8 0.0667 0.1867
3.0 0.0667 0.2000
3.2 0.2000 0.6400
3.4 0.0667 0.2267
3.6 0.0667 0.2400
3.8 0.0667 0.2533
4.0 0.0667 0.2667
4.2 0.0667 0.2800
11
x = ∑ fi .xi = 3.0467
i =1
No exemplo que estamos a seguir, nota-se que x = 3.0467 < Med = Mod = 3.2 , o que é
um sintoma de que a amostra tem uma cauda inferior mais prolongada, isto é, a amostra
denota uma tendência de assimetria, mais concretamente, assimetria negativa. Numa
amostra simétrica, a média, a mediana e a moda coincidem.
Outros parâmetros de localização
Média truncada
Para evitar o efeito das observações extremas (em ambas as caudas da amostra) no
cálculo da média, alguns autores propõem a utilização de uma estimativa da média
truncada, que consiste em eliminar, após ter ordenado a amostra por ordem crescente,
uma determinada percentagem de observações nas caudas inferior e superior da
amostra; após ter eliminado essas observações, calcula-se a média aritmética para as
observações restantes não eliminadas. Logicamente, o tamanho da amostra é reduzido
no número de observações eliminadas.
A média truncada numa percentagem razoavelmente pequena (entre 5% e 20 % de

observações truncadas em cada extremo) é menos sensível que a média aritmética, ao
efeito das observação extremas, mas não tanto quanto a mediana.
Vamos considerar a amostra truncada de borregos, onde se eliminaram as 20% de
observações (3) inferiores e 20% de observações superiores:
xi ni ni .xi
2.4 2 4.8
2.8 1 2.8
3.0 1 3.0
3.2 3 9.6
ESA 2005/2006 16
3.4 1 3.4
3.6 1 3.6
11
N =9 *
∑ n .x
i =1
i i =27.2
k*
∑ n .x i
27.2 i
A média truncada é x = i =1
*
=
= 3.0222 : repare-se que, mesmo após a
N 9
eliminação de 40% das observações, o valor da média pouco se alterou; nesta amostra
truncada, a mediana continua a ser Med = 3.2 , como facilmente se pode deduzir da
tabela anterior.
Média geométrica
A média geométrica é dada por:
N
xG = N ∏ xi = N x1.x2 .x3 ...xN
i =1
A principal propriedade deste indicador é que o logaritmo da média geométrica é igual à

média aritmética dos logaritmos das observações originais. É menos sensível que a
média aritmética à presença de valores extremos. Porém, o seu significado estatístico é
menos intuitivo do que o da média aritmética, além de não estar definida sempre que
existem observações nulas, e em muitas situações de existirem observações negativas.
Média harmónica
A média harmónica é o recíproco (ou inverso) da média aritmética dos recíprocos das
observações:
1 n
xH = N
= N
1 1
∑x
i =1
∑x
i =1
i i
n
A média harmónica não está definida para amostras com valores nulos, e é muito
afectada por valores extremamente baixos.
Tanto a média geométrica como a média harmónica só raramente se utilizam,

nomeadamente em algumas situações em que os dados são de natureza de proporções.
Assim, ao falar-se de média estamos a referirmo-nos à média aritmética.
Quartis
Os quartis são parâmetros de localização que dividem a amostra em quartas partes, isto
é, dividem a amostra em 4 sub-amostras, cada uma com 25% das observações.
ESA 2005/2006 17
Assim o quartil 25%, ou 1º quartil ( Q1 ) é o valor xi tal que existem 25% de

observações iguais ou inferiores a xi ; o quartil 50% ou 2º quartil ( Q2 ) é o valor xi tal
que existem 50% de observações iguais ou inferiores a esse valor, coincidindo com a
mediana; assim, entre o Q1 e Q2 existem 25% de observações. O 3º quartil ( Q3 ) é o
valor xi tal que existem 75% de observações iguais ou inferiores a xi e 25% de valores
acima de xi .
A maneira mais prática de estimar os quartis é a partir da coluna da frequência absoluta

acumulada (ou da frequência relativa acumulada) da amostra.
No exemplo da amostra de borregos, Q1 = 2.4, Q2 = Med = 3.2, Q3 = 3.6 .
Os quartis são úteis a fim de analisar as regiões do intervalo de variação da amostra

onde ocorre maior concentração ou maior dispersão de observações, bem como dá
informação acerca da simetria da amostra (pela comparação das amplitudes das 4 sub-
amostras). O diagrama de extremos-e-quartis, apresentado numa próxima secção, é
baseado na localização dos quartis.
Outros quantis
Além dos quartis, podem considerar-se outros quantis, nomeadamente decis (valores
xi tais que dividem a amostra em sub-amostras com 10% de observações) e percentis
(valores xi tais que dividem a amostra em sub-amostras com a percentagem de
observações pretendida).
O 1º decil é o valor xi tal que existem 10% de observações iguais ou inferiores a xi ; o

9º decil é o valor xi tal que existem 90% de observações iguais ou inferiores a xi . De
igual modo se pode definir qualquer outro decil.
O percentil 5% é o valor xi tal que existem 5% de observações iguais ou inferiores a

xi ; o percentil 95% é o valor xi tal que existem 95% de observações iguais ou
inferiores a xi . De modo similar, se pode definir qualquer outro percentil. O percentil
25% corresponde ao 1º quartil.
Tal como com os quartis, os quantis são deduzidos a partir da tabela de frequências.
Na amostra em análise, o 1º decil é D10 = 2.2 e o 9º decil é D90 = 4.0 . O percentil 5% é

P5 = 2.1 e o percentil 95% é P95 = 4.2 .
Parâmetros de dispersão
Para além de caracterizar a distribuição de uma amostra pela sua tendência de

localização ou tendência central, temos de descrever igualmente a sua tendência de
ESA 2005/2006 18
dispersão ou variabilidade, que é um indicador da variabilidade das observações em

torno dos valores centrais.
Intervalo e amplitude de variação
O intervalo de variação da amostra é o intervalo definido por:
[ x1 , xN ]
isto é, o intervalo definido pelos valores mínimo e máximo da amostra. A Amplitude d
variação (“Range”) é a amplitude deste intervalo:
R = xN − x1
A dispersão ou variabilidade da amostra será maior quanto maior for esta amplitude.
Repare-se que esta apreciação da variabilidade é muito relativa, já que tem em conta
apenas os valores extremos. Por exemplo, a amostra constituída pelas seguintes
observações 10, 10.1, 10.1, 10.2, 10.5, 10.6, 10.6, 10.7, 15 tem uma amplitude de 5
unidades, mas à excepção da observação 15, a amostra é bastante concentrada.
O intervalo de variação da amostra de borregos é [2.1 , 4.2] e a amplitude de variação é

R = 4.2 − 2.1 = 2.1 .
Amplitude inter-quartílica
A amplitude inter-quartílica é definida como:
Q3 − Q1
Embora esta estimativa da variabilidade não seja tanto influenciada pelos valores
extremos e traduza melhor que a amplitude da amostra a maior ou menor tendência de
concentração dos valores em torno da média, ainda não leva em conta todas as
observações presentes na amostra.
Esta medida de variabilidade pode ter pouco significado quando os valores da amostra
estão fortemente concentrados em torno da mediana: a amplitude inter-quartílica é
pequena, mas não diz absolutamente nada acerca da concentração ou dispersão dos
valores abaixo do 1º quartil ou acima do 3º quartil. Considere-se o seguinte exemplo:
10, 50, 50, 50, 50, 50, 50, 50, 50, 80
onde Q1 = Med = Q3 = 50 e Q3 − Q1 = 0 , sendo a amostra muito concentrada em torno

da mediana, mas afinal a distribuição da amostra é entre 10 e 80.
Estas medidas de dispersão, amplitude e amplitude inter-quartílica, são mais úteis na

comparação da variabilidade de diversas amostras retiradas da mesma população do que
na descrição da dispersão de uma única amostra.
ESA 2005/2006 19
Para a amostra de borregos, a amplitude inter-quartílica é de Q3 − Q1 = 3.6 − 2.4 = 1.2 .
Diagrama de extremos-e-quartis
Este diagrama, também designado por caixa-com-bigodes (da tradução literal da sua
designação em Inglês, “boax-and-whiskers”) permite efectuar uma análise gráfica da
variabilidade de uma amostra, bem como analisar a distribuição da concentração nas
quatro sub-amostras definidas pelos quartis (intervalos quartílicos).
Esta representação gráfica consiste em desenhar um rectângulo, com a base na escala

das observações, e em que os dois lados laterais são respectivamente o 1º e 3º quartis;
ligam-se estes lados com um segmento de recta à escala, respectivamente ao valor
mínimo e ao valor máximo da amostra. O rectângulo, que representa a amplitude inter-
quartílica, é dividido pela mediana.
Pela amplitude de cada uma destas quatro sub-amostras, é possível ficar-se com uma
ideia bastante rigorosa de como é o comportamento da amostra, em termos de dispersão
ou concentração de valores, bem como deduzir acerca da sua simetria.
Na amostra de borregos este diagrama tem o seguinte aspecto:
Repare-se que a amostra é mais concentrada nas sub-amostras definidas entre o valor
mínimo e o 1º quartil (1º intervalo quartílico), e entre a mediana e o 3º quartil (3º
intervalo quartílico). A zona de maior dispersão de valores ocorre no 2º intervalo
quartílico. A amostra tem uma ligeira tendência para maior concentração acima da
mediana, pelo que a distribuição resulta ligeiramente assimétrica negativa.
Se existem observações extremas (designadas por outliers), estas são assinaladas no

diagrama de extremos-e-quartis.
ESA 2005/2006 20
Uma observação xi é considerada outlier moderado se:
xi < Q1 − 1.5 × ( Q3 − Q1 ) ou xi > Q3 + 1.5 × ( Q3 − Q1 )
Uma observação xi é considerada outlier extremo se:
xi < Q1 − 3 × ( Q3 − Q1 ) ou xi > Q3 + 3 × ( Q3 − Q1 )
O seguinte diagrama de extremos-e-quartis ilustra a presença de 2 observações outliers

moderadas, uma no extremo inferior e outra no extremo superior, assinaladas com
asteriscos. Repare-se que os “bigodes” da caixa são desenhados após ter decidido que
estas observações são outliers, considerando-se que as observações mínima e máxima
que ficam na amostra após esta eliminação.
Desvio médio
Uma medida da dispersão em torno da média resulta da soma dos desvios de cada
observação para a média:
∑ x −x i
dm = i =1
Se existem valores repetidos, e se se elaborou a tabela de frequências, o desvio médio

pode calcular-se pela expressão:
ESA 2005/2006 21
∑n . x − x i i k
ni k
dm = i =1
=∑ . xi − x = ∑ fi . xi − x
N i =1 N i =1
Este parâmetro mede o afastamento médio de cada observação para a média: quanto
maior for (comparativamente com a média ou com os dados originais), mais dispersa
será a amostra, e consequentemente menos representativa é a média.
Na tabela de cálculo seguinte apresentam-se os cálculos do desvio médio da amostra de

borregos em análise:
xi ni xi − x ni . xi − x
2.1 1 0.9467 0.9467
2.2 2 0.8467 1.6934
2.4 2 0.6467 1.2934
2.8 1 0.2467 0.2467
3.0 1 0.0467 0.0467
3.2 3 0.1533 0.4599
3.4 1 0.3533 0.3533
3.6 1 0.5533 0.5533
3.8 1 0.7533 0.7533
4.0 1 0.9533 0.9533
4.2 1 1.1533 1.1533
11
∑n . x − x
i =1
i i = 8.4533
∑n . x − x i i
8.4533
O desvio médio é dm = i =1
= = 0.5636 .
N 15
O desvio médio também podia ser calculado usando as frequências relativas:
xi fi xi − x fi . xi − x
2.1 0.0667 0.9467 0.0631
2.2 0.1333 0.8467 0.1129
2.4 0.1333 0.6467 0.0862
2.8 0.0667 0.2467 0.0164
3.0 0.0667 0.0467 0.0031
3.2 0.2000 0.1533 0.0307
3.4 0.0667 0.3533 0.0236
3.6 0.0667 0.5533 0.0369
3.8 0.0667 0.7533 0.0502
4.0 0.0667 0.9533 0.0636
4.2 0.0667 1.1533 0.0769
11
dm = ∑ fi . xi − x = 0.5636
i =1
O desvio médio, quando comparado com os valores originais (que variam entre 2.1 e
4.3), ou com o valor da média, embora não seja muito elevado, revela contudo alguma
ESA 2005/2006 22
tendência de dispersão; uma comparação mais objectiva poderá ser obtida pela
dm 0.5636
proporção = = 0.1850 , isto é, o desvio médio é da ordem de 18.5% do valor
x 3.0467
da média.
Variância
A variância é o parâmetro de dispersão mais usual, e aquele que apresenta melhores

propriedades estatísticas. De entre algumas dessas propriedades, destacam-se:
• para distribuições normais, 68.27% dos dados encontram-se no intervalo µ ± σ

• para distribuições normais, 95.45% dos dados encontram-se no intervalo µ ± 2σ
• para distribuições normais, 99.73% dos dados encontram-se no intervalo µ ± 3σ
• se duas amostras, de tamanhos N1 e N 2 provêm da mesma população com
média µ , e com variâncias s12 e s22 , pode estimar-se a variância média
ponderada das duas amostras como:
s2 =
( N1 − 1) .s12 + ( N 2 − 1) .s22
( N1 + N 2 − 2 )
Este resultado pode generalizar-se para o caso de 3 ou mais amostras.
A variância, tal como o desvio médio, é uma medida do afastamento médio de cada uma
das observações em torno da média. No caso do desvio médio, o módulo da diferença
para a média é, por definição, o afastamento de cada observação para a média. No caso
da variância, usa-se o quadrado da distância das observações para a média.
Para a população, a variância é, por definição:
∑(x − µ)
2
i
σ2 = i =1
Contudo, na Estatística não se tem a população, mas sim uma amostra de observações,
geralmente de muito menor dimensão que a população. Demonstra-se que a expressão
anterior, quando aplicada a amostras relativamente diminutas em comparação com a
população (e usando a média amostral x como estimativa da média da população µ )
sub-valoriza o valor da variância (isto é, o valor da variância amostral seria menor que o
valor da variância da população de onde a amostra foi retirada). Para evitar este
enviesamento, utiliza-se a seguinte expressão de cálculo da variância amostral, denotada
com o símbolo s 2 :
∑(x − x )
2
i
s2 = i =1
N −1
ESA 2005/2006 23
Isto é, para evitar a sub-valorização, o divisor é N − 1 .
Esta expressão, para cálculo manual, é de difícil manuseamento. Desenvolvendo

aritmeticamente a expressão anterior, e considerando existem ni observações repetidas
xi , existindo apenas k observações distintas, obtém-se a seguinte expressão, mais fácil
de implementar numa tabela de cálculo, além de que evita o uso repetido do valor da
média, com os erros de arredondamento daí resultantes:
  k  
2
 ∑ i i  
n . x
1  k   = 1  n .x 2 − N .x 2 
k
s =
2
∑ ni .xi −  i =1
2
∑
N − 1  i =1 N  N − 1  i =1 i i 

 
 
 
Repare-se que o valor da variância vem expresso numa escala quadrática, não podendo
portanto comparar-se com os valores originais. Para podermos comparar duas
quantidades, estas têm de estar nas mesmas unidades. Assim, calcula-se a variância, e
de seguida reduz-se para a escala em que estão as observações:
s = ss
Este indicador estatístico (s) designa-se por desvio padrão.
Para comparar o desvio padrão com os valores originais, calcula-se o seguinte

indicador, designado por coeficiente de variação:
s
cv =
x
Como regra de geral, alguns autores consideram a distribuição concentrada se cv ≤ 0.1 ,

e dispersa caso cv > 0.1 .
Para a amostra de borregos, elabore-se a seguinte tabela de cálculo:
xi ni ni .xi2
2.1 1 4.41
2.2 2 9.68
2.4 2 11.52
2.8 1 7.84
3.0 1 9
3.2 3 30.72
3.4 1 11.56
3.6 1 12.96
3.8 1 14.44
4.0 1 16
4.2 1 17.64
11
∑ n .x
i =1
i
2
i = 145.77
ESA 2005/2006 24
Para calcular a variância, basta fazer:
1  k  1
s2 =  ∑ ni .xi2 − N .x 2  = (145.77 − 15 × 3.0467 2 ) = 0.4667
N − 1  i =1  14
O desvio padrão é s = s 2 = 0.4667 = 0.6832 . O coeficiente de variação é

s 0.6832
cv = = = 0.2242 , isto é, o desvio padrão é da ordem de 22.5% do valor da
x 3.0467
média, o que traduz, tal como o desvio médio, uma variabilidade razoavelmente
pequena das observações em torno da média.
Parâmetros de assimetria
A assimetria (em inglês, skewness) é o grau de desvio ou afastamento da simetria de

uma distribuição. Se a curva de frequências de uma distribuição tem uma cauda mais
longa à direita, relativamente à ordenada máxima (moda), diz-se que a distribuição é
assimétrica para a direita, ou que tem assimetria positiva. Se a cauda mais longa é a
esquerda, a distribuição é assimétrica para a esquerda, ou assimétrica negativa.
Assimetria positiva S imétrica Assimetria negativa
Para distribuições assimétricas, a média tende a situar-se do mesmo lado da moda que a
cauda mais longa:
Assimetria positiva Assimetria negativa
M oda x x M oda
Assim, uma medida da assimetria é proporcionada pela diferença entre a média e a

moda, ponderada por uma medida de dispersão (desvio padrão):
x − moda
Assimetria = (primeiro coeficiente se assimetria de Pearson)
s
ESA 2005/2006 25
Para evitar o uso da moda, pode adoptar-se uma relação empírica entre a média, a
mediana e a moda: x − moda = 3 ( x − mediana ) e a assimetria é dada por:
3 ( x − mediana )
Assimetria = (segundo coeficiente se assimetria de Pearson)
s
Outros coeficientes de assimetria são definidos em termos dos quartis e decis; o

coeficiente quartílico de assimetria é definido como:
( Q3 − Q2 ) − ( Q2 − Q1 ) = ( Q3 − 2Q2 + Q1 )
( Q3 − Q1 ) ( Q3 − Q1 )
e o coeficiente percentílico de assimetria é:
( P90 − P50 ) − ( P50 − P10 ) = ( P90 − 2 P50 + P10 )

( P90 − P10 ) ( P90 − P10 )
Um outro coeficiente de assimetria é o coeficiente se assimetria de Fisher, que utiliza o
N
∑(x − x )
3
terceiro momento centrado na média ( m3 = 1
N i ):
i =1
∑(x − x )
1 3
N ( N − 1) m3 N ( N − 1) N i
g1 = × = × i =1
N −2 s3 N −2 s3
Este coeficiente é calculado em diversos programas estatísticos (SPSS, MINITAB,

STATGRAPHICS, etc), muito embora o seu cálculo manual seja algo moroso.
Está provado que para N>150 o coeficiente g1 é assintóticamente normal com média
zero e variância N6 ; o coeficiente de assimetria estandardizado é:
g1
gs =
6
N
Todos estes coeficientes são nulos quando a amostra é perfeitamente simétrica; são
positivos se a amostra é assimétrica positiva ou assimétrica à direita, e são negativos
para amostras assimétricas negativas.
Para a amostra de borregos, estes coeficientes são:
1º coeficiente de assimetria de Pearson:
x − moda 3.0467 − 3.2

Assimetria = = = −0.2244
s 0.6832
ESA 2005/2006 26
2º coeficiente de assimetria de Pearson:
3 ( x − mediana ) 3 × ( 3.0467 − 3.2 )

Assimetria = = = −0.6732
s 0.6832
Coeficiente quartílico de assimetria:
( Q3 − 2Q2 + Q1 ) = 3.6 − 2 × 3.2 + 2.4 = −0.3333

( Q3 − Q1 ) 3.6 − 2.4
Coeficiente percentílico de assimetria:
( P90 − 2 P50 + P10 ) = 4.0 − 2 × 3.2 + 2.2 = −0.1111

( P90 − P10 ) 4.0 − 2.2
Todos estes coeficientes indicam que a distribuição da amostra é ligeiramente enviezada

à esquerda, ou assimétrica negativa.
O coeficiente de assimetria de Fisher é:
N
0.4342
∑(x − x )
1 3
N ( N − 1) m3 N ( N − 1) N i
15 ×14
g1 = × = × i =1
= × 15 3 = 0.1012
N −2 s3 N −2 s3 13 0.6832
Nota-se que este coeficiente indica uma ligeira assimetria positiva, em contradição com
os coeficientes anteriores. Antes de mais, este coeficiente é mais rigoroso que os
anteriores, pois no seu cálculo entram todas as observações. Além disso, esta
discrepância é devida a que a tendência de assimetria é mínima: qualquer dos
coeficientes é, em valor absoluto, muito baixo, o que indica que a distribuição é
praticamente simétrica, donde resulta a aparente contradição dos coeficientes.
Parâmetros de forma
Além da simetria, as distribuições também se costumam caracterizar quanto à altura do

ponto máximo da curva de distribuição. Esta característica é designada por achatamento
ou curtose (em inglês, kurtosis).
Leptocúrtica
Platicúrtica Mesocúrtica
ESA 2005/2006 27
A distribuição chamada mesocúrtica tem no centro uma altura correspondente à curva

da função de densidade da distribuição normal.
A distribuição diz-se platicúrtica se tem altura inferior à da curva normal. Repare-se que
o facto de a distribuição ter altura menor no centro, significa maior proporção de
observações nas caudas, isto é, é sintoma de uma forte dispersão.
A distribuição diz-se leptocúrtica se tem altura superior à da curva normal. O facto de a

distribuição ter altura maior no centro, significa maior proporção de observações nas
proximidades dos valores centrais, isto é, é sintoma de uma forte concentração em torno
da média.
Um coeficiente numérico para caracterizar o achatamento é o coeficiente percentílico de

achatamento:
( Q3 − Q1 )
k= 2
P90 − P10
Para uma curva normal, o valor deste coeficiente é k = 0.263 . Um valor inferior é
sintoma de uma curva muito achatada, e um valor superior é sintoma de uma curva
demasiado alta.
Os programas estatísticos usam outro coeficiente de achatamento, designado por

coeficiente de achatamento de Fisher, que é baseado no 4º momento centrado na média
N
∑(x − x )
4
( m4 = 1
N i ):
i =1
g2 =
( N + 1)( N − 1) ×  m4 − 3 ( N − 1) 
( N − 2 )( N − 3)  s 4 N +1 

Para uma curva normal, o valor deste coeficiente é g = 0 . Um valor negativo é sintoma
de uma curva muito achatada, e um valor positivo é sintoma de uma curva demasiado
alta.
Para a amostra de borregos, o coeficiente percentílico de achatamento é:
( Q3 − Q1 ) 3.6 − 2.4
k= 2 = 2 = 0.3333
P90 − P10 4.0 − 2.2
indicando que a distribuição tem uma ligeira tendência de ser mais alta no centro que a
distribuição normal. O coeficiente baseado no 4º momento é g 2 = −1.1421 . Mais uma
vez, a contradição entre este coeficiente e o coeficiente percentílico pode explicar-se
pelo facto de este coeficiente g 2 é mais rigoroso pois leva em conta todas as
observações (e não apenas os quartis e percentis).
ESA 2005/2006 28
ESA 2005/2006 29

Estatistica Descritiva Texto

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Estatistica Descritiva Texto

Transféré par

Droits d'auteur :

Formats disponibles

Estatística Descritiva

O objectivo da Estatística Descritiva é o de representar de uma forma concisa, sintética

O conjunto de dados, por maior que seja, raramente corresponde à totalidade da

Os dados em análise são os registos de observações de características em indivíduos (ou

Designa-se por população (ou universo) o conjunto de dados que expressam a

Geralmente o tamanho (isto é, o número de elementos) da amostra é muito reduzido,

• A população é infinita, ou considerada como tal, não podendo portanto ser

A título de exemplo, considerem-se os seguintes universos estatísticos, e tente-se

• Caracterização das intenções de voto de uma população eleitora constituída por

O processo de selecção de uma amostra a partir de uma população designa-se por

De todos os processos de amostragem probabilística, o mais importante é o de

Existem outros métodos de amostragem probabilística, como seja a amostragem

Seguidamente exemplificam-se alguns possíveis tipos de enviesamento que podem

População: intenções de voto dos eleitores de uma cidade.

População: incidência da mosca da azeitona nos olivais de uma zona agrícola.

População: diâmetros das árvores de um povoamento de pinheiro bravo.

População: pesos médios de coelho bravo numa zona de caça.

Nos processos experimentais exerce-se um controle directo sobre os factores que

Nos processos observacionais, os factores que potencialmente afectam a característica

Caracterização de amostras univariadas

As formas mais comuns de descrever amostras univariadas com dados expressos em

Designa-se por frequência absoluta da categoria i o número de dados contidos na

Se expressamos o número de dados da i.ésima categoria em termos de proporção do

As frequências relativas são muitas vezes definidas em termos percentuais:

Um rebanho de 150 ovelhas foi analisado relativamente à característica “número de

categoria 0: ovelhas não paridas (isto é, 0 borregos nascidos por ovelha);

A seguinte tabela de frequências resume o número de ovelhas (frequência absoluta) e a

Categoria Frequência absoluta Frequência relativa (%)

Esta tabela de frequências pode representar-se graficamente, num gráfico de barras, em

Diagrama de barras das frequências absolutas:

Diagrama de barras das frequências relativas:

Note-se que, seja o gráfico elaborado na escala de frequências absolutas ou de

O gráfico de sectores, mais difícil de elaborar manualmente, divide a área do círculo

De uma maneira geral, a análise de amostras de dados quantitativos pode incluir o

Amostras de pequena dimensão, com dados não agrupados em classes

4.2 2.8 3.2 3.0 3.8 3.2 4.0 3.6

O tamanho da amostra é N = 15 observações.

Quando as amostras são de pequenas dimensões, pode dispensar-se a elaboração de

Aliás, refira-se que a elaboração do histograma em pequenas amostras pode ocasionar

Repare-se que a análise do gráfico pode induzir à conclusão de que a amostra é

Para a amostra de borregos em análise, a tabela de frequências e o histograma têm o

3.2 3 10 0.2000 0.6667

Conforme referido anteriormente, devido ao reduzido tamanho da amostra, a tabela de

Diagrama de pontos (“dotplot”)

Para a amostra de borregos em análise, o diagrama de pontos tem o seguinte aspecto:

O aspecto informativo mais notório neste exemplo é o facto de destacar mais

Diagrama de caule-e-folhas (“stem-and-leaf”)

Este tipo de representação gráfica é uma maneira simples e engenhosa de apresentar os

Para construir um diagrama de caule-e-folhas:

1 – Se os valores numéricos têm um único dígito, normalmente usa-se o algarismo zero

aparece a frequência absoluta acumulada em modo inverso, isto é, desde metade da

Consideremos a seguinte amostra de valores de uma variável aleatória X genérica:

O diagrama de caule-e-folhas, elaborado numa aplicação estatística (MINITAB) é o

À esquerda é apresentada uma coluna com as frequências absolutas acumuladas. A

Quando o intervalo de variação da amostra é muito estreito, por exemplo no exemplo

Para a amostra de borregos em análise temos o seguinte diagrama de caule-e-folhas:

Na análise de dados numéricos usam-se determinados indicadores estatísticos que

É o valor mais frequente (com maior frequência absoluta ou relativa) na amostra.

Conforme anteriormente referido, em pequenas amostras não é muito usual elaborar a

Da tabela de frequências apresentada anteriormente para a amostra de borregos em

Se o tamanho de amostra é ímpar, existe um valor central, isto é, a mediana é o valor

Temos uma amostra com N = 15 observações, donde a mediana será o valor x8 . Da

A grande vantagem da utilização da mediana como parâmetro de localização, reside no