Vous êtes sur la page 1sur 50

Fundamentos de Estatística – Aula 2

– Estatística descritiva: Organização


dos dados

Prof. Me. Octaviano Rojas Luiz


(orojasluiz@yahoo.com.br)
Tipos de variáveis
• Considere o seguinte exemplo:
• Um pesquisador está interessado em estudar
aspectos socioeconômicos dos empregados da
seção de orçamentos da Companhia MB.

2
Variável Representação
Estado Civil X
Grau de instrução Y
Número de Filhos Z
Salário S
Idade U
Região de procedência V

3
4
5
• Educação e estado civil representam uma
qualidade (ou atributo)  Variáveis
qualitativas
• Idade e salário são representados por
números obtidos por contagem ou
mensuração  Variáveis quantitativas

6
Variáveis qualitativas
• Duas classificações:
– Nominal: Não existe nenhuma ordenação
possível. Ex: Região de procedência
– Ordinal: existe uma ordem para os
resultados. Ex: Grau de instrução

7
Variáveis quantitativas
• Discretas:
– Valores formam um conjunto finito ou enumerável
– Resultam, frequentemente, de uma contagem
– Ex: número de filhos (0, 1, 2, ...)
• Contínuas:
– Pertencem a um intervalo de número reais
– Ex: Estatura e peso

8
9
• Tipo de variável  técnica específica
• Algumas variáveis quali pode ser
transformadas em variáveis quanti.
• Exemplo variáveis dicotômicas:
sucesso/fracasso e estado civil.

10
Distribuição de frequências
• Quando se estuda uma variável queremos
conhecer seu comportamento.
• Analisamos a ocorrência de suas possíveis
realizações.
• Considere a tabela com os dados iniciais.
• Qual é a frequência de cada grau de
instrução?

11
• 12 funcionários têm ensino fundamental, 18
têm ensino médio e 6 têm ensino superior.
• Uma medida útil é a proporção de cada
realização e relação ao total
• Ex: 6/36 = 0,1667 = 16,67% dos empregados
com ensino superior

12
Distribuição de Frequências

13
• Notações:
– ni para indicar a frequência (absoluta) de
cada classe
– n é o número total de observações
– fi = ni/n para indicar a proporção (frequência
relativa)

14
• As proporções são úteis se queremos
comparar pesquisas distintas
• Digamos que a Companhia MB tenha 2000
empregados com a seguinte distribuição de
frequências.
• Queremos comparar os resultados da seção
com toda a empresa

15
16
• Não podemos comparar frequências, pois os
totais de empregados são diferentes
• Podemos comparar as proporções, pois
reduzimos as frequências a um mesmo total.

17
Tabelas de frequência para variáveis
contínuas
• A construção da tabela para a variável salário
usando o procedimento anterior não reduziria
os dados.
• Não existem dados iguais.
• A solução empregada é agrupar os dados por
faixas de salários.

18
19
• Ao resumir os dados perdemos informação
• Não sabemos quais são os 8 salários da classe
12 a 16 (sem consultar os dados originais).
• Poderíamos supor que todos os salários
fossem iguais ao ponto médio (14).
• Notação para o intervalo contendo o
extremo a não contendo b

20
• A escolha dos intervalos é arbitrária.
• Deve-se levar em conta que:
– Poucas classes  perde-se informação
– Muitas classes  dados não são resumidos
• Variáveis discretas com um conjunto de
valores muito grande também são
resumidas por faixas.

21
• Sugere-se de 5 a 15 classes com amplitudes
semelhantes
• A seguinte regra pode ser útil

22
Frequências acumuladas
• A frequência acumulada até um certo valor é
obtida pela soma das frequências de todos os
valores da variável, menores ou iguais ao valor
considerado.
• Possível de se empregar em variáveis
qualitativas ordinais e quantitativas
• Ex: quantos funcionários da seção recebem
menos de 16 salários mínimos?

23
Gráficos
• Uma forma rápida e concisa de informar sobre a
distribuição da variável
• Para variáveis qualitativas: Gráficos em barras e
de pizza
• Gráfico de barras: construção de retângulas em
que uma das dimensões é proporcional à ni ou fi
e a outra arbitrária e igual para todas as barras
• Ex: Variável Y - Grau de instrução

24
25
• Gráfico de composição de setores (pizza)
– Representa a composição, geralmente em
porcentagem, de partes de um todo
– Círculo de raio arbitrário com área dos setores
proporcional à frequência.
– Muitas vezes usa-se um retângulo no lugar de um
círculo

26
27
Gráficos para variáveis quantitativas
• Temos uma variedade maior de gráficos.
• Vamos analisar a variável Z, número de filhos dos
empregados da seção de orçamentos. Podem ser
aplicados os gráficos anteriores

28
Gráfico em barras para Z

29
Gráfico de dispersão unidimensional
• Valores são representados por pontos ao
longo da reta (provida de uma escala).
• Três possibilidades:
a) Valores repetidos são indicados por um
número que indica as repetições.
b) Pontos “empilhados”
c) Só representa o ponto mais alto da pilha

30
31
• Para variáveis contínuas, necessita-se de adaptações.
• Consideremos a variável S (salários)

32
• Podemos usar o artifício de aproximar a
variável contínua por uma discreta.
• Exemplo: supomos que todos os salários de
uma classe são iguais ao ponto médio desta
classe.
• Os 10 salários da primeira classe serão
admitidos igual a 6

33
34
Histograma
• Uma alternativa ao gráfico de dispersão
• Gráfico de barras contíguas.
• Bases iguais aos intervalos das classes.
• Área igual à respectiva frequência (relativa ou
absoluta).
• Indiquemos a amplitude do i-ésimo intervalo
por

35
• Para que a área seja igual a fi, a sua altura
deve ser igual a fi/
• Esta razão é chamada de densidade de
frequência da i-ésima classe
• A área total do histograma é igual a 1 (

36
37
• Também podemos construir histogramas para
variáveis discretas:

38
Ramo-e-folhas
• Histograma e gráfico de barras dão uma ideia
da forma da distribuição da variável.
• Veremos adiante algumas medidas da
distribuição da variável (medidas de posição e
dispersão).
• A forma da distribuição é tão importante
quanto estas medidas!

39
Ramo-e-folhas
• O gráfico de ramo-e-folhas é um
procedimento alternativo para se determinar
a forma.
• Uma vantagem sobre o histograma é que
perdemos pouca ou nenhuma informação.

40
Ramo-e-folhas
• Exemplo: Consideremos os salários dos 36
empregados da companhia MB
• Não existe uma regra exata.
• A ideia é dividir a observação em duas partes:
– Ramo: a esquerda de uma linha vertical.
– Folha: a direita.

41
• As observações 4,00 e 4,56 poderiam fazer
parte do mesmo ramo 4 com folhas 00 e 56.
• Quanto mais folhas um ramo tem maior sua
incidência.

42
43
Ramo-e-folhas
• Podemos extrair algumas informações:
– O valor 23,30 se destaca
– Os demais valores estão concentrados entre 4,00
e 19,40
– Um valor + ou – típico poderia ser 10,00
– Há uma leve assimetria com relação aos salários
menores  podemos questionar se esta amostra
pertence à uma população com distribuição
simétrica

44
Exercício
• Dados de dureza de 30 peças de alumínio

45
Exercício
• Construa o gráfico de ramo-e-folhas da
seguinte forma:
• Trunque os dados, ou seja, omita os décimos.
• Ramo: valor da dezena
• Folhas: valor das unidades
• Ex: 70,2  Ramo = 7 e folha = 0

46
47
• Este é um exemplo com muitas folhas por
ramo.
• Uma alternativa seria duplicar os ramos.
• Exemplo: dividindo os ramos em duas linhas
• Linha 1 (*): folhas de 0 a 4
• Linha 2 (.) : folhas de 5 a 9

48
49
Trabalho
• Exercício: MB –Indústria e Comércio
• Enunciado distribuído no dia da aula
• Será enviado conjuntamente a este material.

50

Vous aimerez peut-être aussi