Vous êtes sur la page 1sur 45

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE – UFRN

DEPARTAMENTO DE ESTATÍSTICA – CCET


DOCENTE: Lígia Magnólia Confessor Rocha

UNIDADE II
ESTATÍSTICA DESCRITIVA

Natal/RN
2015
Representação dos Dados
• Nesta unidade, trataremos da questão das tabelas e
gráficos estatísticos. Também observaremos as séries
estatísticas que são de fundamental importância no
estudo descritivo. Pois, em todo estudo estatístico os
dados observados necessitam serem organizados para
que se faça a análise dos mesmos.
Representação dos Dados
• Estudaremos nessa unidade os seguintes itens:

1 - Tabelas
2 – Séries Estatísticas
3 – Representação Gráfica
4 - Tipos de Gráficos
5 - Distribuição de Frequência
1 - Tabelas Estatísticas
• A apresentação tabular é uma apresentação numérica
dos dados. Consiste em dispor os dados em linhas e
colunas distribuídos de modo ordenado, segundo
algumas regras. As regras que prevalecem no Brasil
foram fixadas pelo Conselho Nacional de Estatística.
1 - Tabela

• Uma tabela compõe-se de: título, cabeçalho, corpo,


rodapé e colunas (indicadoras e numéricas).

Título: O que? Onde? Quando? (fato, local e tempo)


Cabeçalho Cabeçalho
Corpo da
tabela

Coluna Coluna
indicadora numérica

Rodapé: fonte, notas e observações.

O cruzamento de linha com a coluna


chama-se casa ou célula.
OBSERVAÇÕES

1) Não delimitar (fechar) por traços verticais, os


extremos da tabela, à direita e à esquerda;

2) Usa-se um traço horizontal (-) quando o dado for nulo,


inexisti o fenômeno;
OBSERVAÇÕES

3) Usa-se (...) quando não se dispuser dos dados, embora


ele possa ser quantificado;

4) Usa-se zero (0) quando o valor é muito pequeno para


ser expresso pela unidade utilizada.

5) Usa-se uma interrogação (?) quando o valor é


duvidoso.
2 – Séries Estatísticas

• É um conjunto de dados estatísticos referenciados aos


seguintes fatores: tempo, local e fenômeno.

- Série Temporal ou Cronológica.


- Série Geográfica.
- Série Especificativa.
- Série Mista.
Série Temporal ou Cronológica

• Nesta série o elemento de variação é o tempo (dia, mês,


ano, etc).
Série Geográfica

• O elemento de variação é o lugar (município, bairro,


escola, etc).
Série Especificativa

• O elemento de variação é a espécie (material escolar,


produto de uma fábrica, remédios, etc).
Série Mista

• É a junção de duas ou mais séries simples (geográfica,


especificativa ou temporal).
3 – Representação Gráfica

• Em relação a uma tabela estatística um gráfico


estatístico possibilita uma impressão visual mais rápida
da distribuição dos valores em estudo. Isto não significa
que a representação tabular seja de pouca utilidade,
mas a representação gráfica vem para complementá-la.
Requisitos Fundamentais
• Simplicidade:
Deve possibilitar a análise rápida do fenômeno
em estudo. Deve conter apenas o essencial.

• Clareza:
Deve possibilitar uma correta interpretação dos
valores representativos do fenômeno em estudo.

• Veracidade:
Deve expressar a verdade sobre o fenômeno em
estudo.
4 - Tipos de Gráficos

• Diagramas;

• Cartogramas;

• Pictogramas.
Diagramas

• São gráficos geométricos de no máximo três dimensões.


Para sua construção usa-se o sistema cartesiano.
Cartogramas

• É a representação sobre uma carta geográfica. Este


gráfico é empregado com o objetivo de representar
dados estatísticos diretamente relacionados com áreas
geográficas ou políticas.
Pictogramas

• Constitui um dos processos gráficos que melhor fala ao


público, pela sua forma ao mesmo tempo atraente
e sugestiva. A representação gráfica consta de figuras
que lembrem o fato considerado.
5 – Distribuição de Frequência

• Na estatística trabalha-se, habitualmente, com grande


número de informações, resultados de medições
realizadas. Que podem ser dados discretos (o valor
inteiro que não pode ser partido) ou contínuo (em
intervalos).
DISTRIBUIÇÕES DE FREQUÊNCIAS
DISTRIBUIÇÃO DE FREQUÊNCIAS:
SIMPLES
• Série estatística para dados nominais, ordinais e discretos, organizados em uma
tabela.
• Ex.: dados nominais: Sexo, estado civil, etc.
• Ex.: dados ordinais: Desempenho escolar, ordem de chegada
• Ex.: dados discretos: Nº de cárie em crianças...

POR CLASSES
• Série estatística para dados contínuos.
• Ex.: dados contínuos: Peso, altura, etc.
• Pode ser utilizada para dados discretos se os mesmos forem em sua maioria
diferentes.
DISTRIBUIÇÕES DE FREQUÊNCIAS
Para a construção de uma distribuição de freqüências em classes são
necessários os seguintes componentes:

 Dados brutos,
 Rol,
 Amplitude total,
 Número de classes;
 Intervalo de cada classe.
Dados Brutos:
Ex.: Massa corporal (kg) de 48 alunos de uma turma de Estatística
55 57 66 45 48 92 85 63 56 48 46 54 70 90 76 63 48 50 58 60 82 61 90 72 101

59 52 49 54 80 95 82 70 58 70 67 75 58 68 68 70 63 71 56 65 52 76 68
DISTRIBUIÇÕES DE FREQUÊNCIAS
Rol: São os dados apresentados em ordem crescente ou
decrescente
45 46 48 48 48 49 50 52 52 54 54 55 56 56 57 58 58 58 59 60 61 63 63 63 65
66 67 68 68 68 70 70 70 70 71 72 75 76 76 80 82 82 85 90 90 92 95 101

Amplitude Total - At: At = Ls - Li Onde:

Ls - Limite Superior
At = 101 – 45 = 56kg
Li - Limite Inferior
DISTRIBUIÇÕES DE FREQUÊNCIAS

Número de Classes - c
Corresponde à quantidade de classes, nas quais serão agrupados os
elementos do rol.

c = 1 + 3,333...log(n) Onde;

n corresponde ao número de elementos do rol.


c = 1 + 3,333 log 48
c = 6,59853332
c≈ 7
DISTRIBUIÇÕES DE FREQUÊNCIAS
- Intervalo de cada classe – i

i = At/c i = 56/7  i = 8 kg

Tabela 1: Massa Corporal (Kg) dos alunos Do Curso de Estatística


Massa Corporal Nº de Alunos (f ) f%
45|– 53 9 18,8
53 |– 61 11 22,9
61 |– 69 10 20,8
45+8=53 69 |– 77 9 18,8 (9/48)*100=18,8
77 |– 85 3 6,2
85 |– 93 4 8,3
93 |–| 101 2 4,2
 48 100
Fonte: Pesquisa, maio/2003.
MEDIDAS DE TENDÊNCIA CENTRAL
E DE DISPERSÃO
MEDIDAS DE TENDÊNCIA CENTRAL
 As principais são: Média Aritmética, Mediana e Moda

1. Dados apresentados em forma de rol;


MÉDIA ARITMÉTICA
2. Dados apresentados em forma de:
• Populacional - µ (mi)
- distribuição de frequência simples;
• Amostral - (X-barra)
- distribuição de frequência com
classes.
1. Dados apresentados em forma de rol:
n

x i
soma de todos os elementos do rol
X i1

n número de elementos do rol
MEDIDAS DE TENDÊNCIA CENTRAL
E DE DISPERSÃO
Exemplo: Peso em gramas de 12 ratos

(50, 62, 70, 86, 60, 64, 66, 77, 58, 55, 82, 74)  = = 804/12= 67
Análise: o peso médio dos 12 ratos observados é de 67 gramas.

2. Dados apresentados em formande distribuição de frequência simples:


 xifi
X  i1n
 fii 1

Exemplo: Número de cáries em crianças


X 0 1 2 3 4 Total
f 2 4 10 6 5 27
MEDIDAS DE TENDÊNCIA CENTRAL
E DE DISPERSÃO
n

x f i i
(0).(2)  (1).(4)  (2).(10)  (3).(6)  (4).(5)
X i1
n
  2,3
27
f
i 1
i

Média para distribuição de frequência com classes


MEDIDAS DE TENDÊNCIA CENTRAL
E DE DISPERSÃO
Exemplo: Nascidos vivos segundo o peso ao nascer, em kg.
Classes fi Pm
1,5 |- 2,0 3 1,75
2,0 |- 2,5 16 2,25
2,5 |- 3,0 31 2,75
3,0 |- 3,5 34 3,25
3,5 |- 4,0 11 3,75
4,0 |- 4,5 4 4,25
4,5 |-| 5,0 1 4,75
Total 100 -
Fonte: Dados fictícios
n

P f
m i
(1,75).(3)  (2,25).(16)    (4,75).(1)
X i1
n
 3
100
f i 1
i
MEDIDAS DE TENDÊNCIA CENTRAL
E DE DISPERSÃO
Mediana
Valor que divide a distribuição em duas partes iguais, em relação à quantidade de
elementos. Isto é, é o valor que ocupa o centro da distribuição, de onde se conclui
que 50% dos elementos ficam abaixo dela e 50% ficam acima.

0 Mediana=50% 100%
• Se "n" for ímpar:
Med = elemento central de ordem
MEDIDAS DE TENDÊNCIA CENTRAL E
DE DISPERSÃO
• Se "n" for par:
n n 
Med = média aritmética dos dois elementos centrais de ordens   e   1
2 2 
Exemplo (dados em forma de rol):
Seja a amostra: 8, 10, 12, 14, 16, 19
n 6
      3 elemento do rol
2 2
n  6 
  1    1  4 elemento do rol
2  2 

3 elemento  4 elemento 12  14
Med    13
2 2
Interpretação: a média aritmética do 3º e 4º elemento do rol (13) divide 50% da
distribuição dos dados à direita e à esquerda.
MEDIDAS DE TENDÊNCIA CENTRAL E
DE DISPERSÃO
Exemplo (dados em uma distribuição de frequência simples):
Suponha a seguinte distribuição de frequência simples.

X fi F↓ n = 42 (par)
82 5 5
Elemento mediano: (n/2) = 21º elemento
85 10 15
87 15 30 (n/2) + 1 = 22º elemento
89 8 38
3ª classe contém o 21º e o 22º elemento
90 4 42
Total 42 - Med=(87+87)/2=87
MEDIDAS DE TENDÊNCIA CENTRAL E
DE DISPERSÃO

Moda: É o valor que ocorre com mais frequência em determinada


amostra.

Exemplo: Na série: 3 5 6 6 6 7 8 8 9

Mo=6
MEDIDAS DE TENDÊNCIA CENTRAL E
DE DISPERSÃO

Será que a média sempre é confiável?

Calcule a média nos casos abaixo:


• X: 70, 70, 70, 70, 70
• Y: 68, 69, 70, 71, 72
• Z: 5, 15, 50, 120, 160

X
 x i
X
350
 70 Y
 y i
Y
350
 70 Z
 z i
Z
350
 70
n 5 n 5 n 5

Não há variabilidade Baixa variabilidade Alta variabilidade


MEDIDAS DE TENDÊNCIA CENTRAL E
DE DISPERSÃO

Já que a média nesse caso não é eficaz, então o que poderíamos usar?

Resposta: Podemos utilizar as medidas de dispersão! ! !


Medidas de Dispersão
 Variância Populacional (σ2)

 x  
2

 2
 i

N
 Variância Amostral (s2)

 x  x
2

S 2
 i

n 1
Medidas de Dispersão
• VARIÂNCIA (dados em Classes)
Quando os dados estão em classes podemos
utilizar a fórmula a seguir:
n

 fi ( Pmi  x ) 2
S2  i 1
n

f
i 1
i
ou
n

 fi  Pmi 2
S2  i 1
x
n
Medidas de Dispersão
• VARIÂNCIA (dados em forma de rol)

Exemplo: Calcule a variância da estatura de cinco


jogadores de basquete disponibilizados a seguir:

1,92 1,72 1,82 1,80 1,84


1,92  1,72  1,82  1,80  1,84 9,1
x   1,82
5 5
Medidas de Dispersão
• Solução
1,92  1,82   1,72  1,82   1,82  1,82   1,80 1,82   1,84 1,82 
2 2 2 2 2

S 2

5 1

 0,1   0,1   0    0, 02    0, 02 


2 2 2 2 2


4
0, 01  0, 01  0  0,0004  0,0004

4
0,0208
  0,0052.
4
Medidas de Dispersão
• VARIÂNCIA (dados em Classes)

Exemplo: Considere a seguinte distribuição de


dados.
Tabela 4 -

Nº de seguros F Pm

0 ⱶ 10 9 5
10 ⱶ 20 11 15
20 ⱶ 30 12 25
30 ⱶ 40 10 35
40 ⱶ 50 8 45
Σ 50 -
Fonte: Dados fictícios
Medidas de Dispersão
• Solução

• 1º Passo: Calculamos a média dos dados


n

p m i f
1220
x i 1
n
x  24, 4
f i 1
i
50
Medidas de Dispersão
• 2º Passo: Calcular a variância n

 fi ( Pmi  x ) 2
S 
2 i 1
n
Utilizando a primeira fórmula temos: f
i 1
i

9(5  24, 4) 2
 11(15  24, 4) 2
 12(25  24, 4) 2
 10(35  24, 4) 2
 8(45  24, 4) 2
S2 
50

3387, 24  971,96  4,32  1123, 6  3394,88


S 
2
 177, 64
50
Medidas de Dispersão
Utilizando a segunda fórmula temos:
n

 fi  Pmi 2
S2  i 1
x
n

38650
S 
2
 (24, 4) 2

50
S 2  773  595,36
S 2  177, 64
Medidas de Dispersão
“Desvantagem” do uso da variância

• No cálculo da variância, quando elevamos ao quadrado


a diferença , a unidade de medida da série fica também
elevada ao quadrado.

• Portanto, a variância é dada sempre no quadrado da


unidade de medida da série. Se os dados são expressos
em metros, a variância é expressa em metros
quadrados.
Medidas de Dispersão
• Em algumas situações, a unidade de medida da
variância nem faz sentido. É o caso, por exemplo, em
que os dados são expressos em litros. A variância será
expressa em litros quadrados?

• Logo, o valor da variância não pode ser comparado


diretamente com os dados da série,
ou seja: variância não tem interpretação. Que solução
poderíamos tomar?

Usar o DESVIO-PADRÃO ! ! !
Medidas de Dispersão
• Desvio Padrão

O desvio padrão nada mais é que a raiz


quadrada da variância.

Populacional Amostral

 x     x  x 
2 2

 i
S  i

N n 1