Vous êtes sur la page 1sur 143

Aula de Estatstica Descritiva

Fabio Azevedo de Souza

Material em construcao

e-mail: fabioazevedo1@hotmail.com

18 de setembro de 2017

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 1 / 133


Sumario

1 Introducao

2 Distribuicao de frequencia

3 Medidas de resumo

4 Medidas separatrizes

5 Medidas de dispersao assimetria e curtose

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 2 / 133


Introducao

Historia

Pode-se buscar as origens no aparecimento do primeiro


homem. No tempo dos romanos, ja havia uma
tendencia de registro, e o nascimento de Cristo teve
lugar quando a Santa Famlia encaminhava-se para uma
cidade natal, para la ser recenseada. Muitos seculos
antes, CONFUCIO (sabio Chines)demonstrava terem
os chineses instrucoes estatsticas; o mesmo pode-se
dizer dos Egpcios e Persas, entre outros povos da
antiguidade. E ainda, entre os Romanos, encontrou-
se a primeira tentativa de um registro sistematico de
informacoes, Nascimento e Obito.
Figura: Pre-historia
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 3 / 133


Introducao

Forma e Uso

CENSOS, originou-se do latim CENSUS que quer dizer conjunto de dados estatsticos dos
habitantes de uma cidade, provncia, estado, nacao.
O Censo mais remoto e registrado e o da China, em 2.238 a.C., onde o imperador Yao
mandou realizar um censo da populacao e das lavouras cultivadas;
Outro, foi um Censo registrado no tempo de Moises, cerca de 1.700 a.C.
Os egpcios fazia recenseamento anualmente, XVI a.C.
Os romanos realizavam Censo por volta de 8 a.C;
No Brasil, em 1872, realizou-se o primeiro recenseamento nacional chamado Recenseamento
da Populacao do Imperio do Brasil.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 4 / 133


Introducao

Fundamentacao matematicos

Seus fundamentos matematicos foram postos no seculo XVII com o desenvolvimento da teoria
das probabilidades por Pascal e Fermat, que surgiu com o estudo dos jogos de azar.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 5 / 133


Introducao

Definicoes

Definicao 1
A estatstica e uma ciencia da tomada de decisao diante de incertezas. (definicao ampla de
estatstica)

Definicao 2
A estatstica moderna e muito mais do que uma caixa de ferramentas, um saco de magicas,
ou uma miscelanea de tecnicas isoladas uteis nas ciencias individuais. Existe uma unidade nos
metodos da estatstica. (Stigler, 1986)

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 6 / 133


Introducao

Definicoes

Definicao 3
A estatstica e o estudo das qualidades (atributos) caractersticas coletivas da populacao.
(Egon Pearson)

Definicao 4
O objeto da estatstica moderna abrange a coleta, apresentacao e caracterizacao da
informacao para ajudar a ambos, analise de dados e o processo de tomada de decisao.
(Berenson & Levine, 1989)

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 7 / 133


Introducao

Pensamento estatstico

Pensamento Estatstico:
E um modo de pensar que reconhece que nossas
observacoes sobre o mundo nao podem ser completamente
exatas: elas estao sempre sujeitas a alguma incerteza.
E um processo de pensamento que reconhece que a
variacao esta presente em tudo o que fazemos.

Figura: Apresentacao de dados

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 8 / 133


Introducao

Pensamento Estatstico

O pensamento estatstico sera um dia tao necessario para o cidadao quanto a habilidade de
ler e escrever.(Wells, H. G., 1993)

Caracterstica fundamental
Variabilidade

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 9 / 133


Introducao

A estatstica transforma

Figura: Mudando de vida figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 10 / 133


Introducao

Tipos de Estudo

1 Absolutos:
objetivam determinar propriedades de conjuntos definidos de objetos
Estimacao do diametro medio de uma fibra de algodao; estimacao do gasto medio com
alimentacao pelas famlias brasileiras
2 Comparativos:
objetivam comparar condicoes, procedimentos
Observacionais
Experimentais

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 11 / 133


Introducao

Tipos de Estudo

Experimentais - a designacao dos tratamentos as unidades e feita pelo pesquisador.

Observacionais - o investigador nao tem o controle sobre a designacao dos tratamentos


considerados para as unidades.

Os estudos observacionais sao mais sujeitos a tendencias e, consequentemente, a


avaliacao de efeitos causais fica comprometida.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 12 / 133


Introducao

Metodo cientfico

Figura: Ilustracao do metodo

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 13 / 133


Introducao

Fases do trabalho estatstico

DEFINICAO DO PROBLEMA

Figura: Pesquisadores figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 14 / 133


Introducao

Fases do trabalho estatstico

PLANEJAMENTO

figuras/ufrn
Figura: Planejando
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 15 / 133
Introducao

Fases do trabalho estatstico

COLETA DE DADOS

Figura: Formas de coleta de dados figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 16 / 133


Introducao

Fases do trabalho estatstico

CRITICA DOS DADOS

Figura: Trabalho em equipe figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 17 / 133


Introducao

Fases do trabalho estatstico

ORGANIZACAO

figuras/ufrn
Figura: Dados

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 18 / 133


Introducao

Fases do trabalho estatstico

REPRESENTACAO DOS DADOS

figuras/ufrn
Figura: Graficos e tabelas

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 19 / 133


Introducao

Fases do trabalho estatstico

ANALISE DOS RESULTADOS

Figura: Graficos e tabelas


figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 20 / 133


Introducao

Aplicacao

Administracao
Economia
Pesquisa cientfica
Marketing e pesquisa de mercado
Industria
Mercado financeiro
Comercio
Medicina
Literatura
Direito
Arqueologia
figuras/ufrn
Engenharia e arquitetura
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 21 / 133
Introducao

Aplicacao

DEMOGRAFIA, ANTROPOLOGIA, SOCIOLOGIA.

Recenseamento: Tem como interesse observar o comportamento de algumas caractersticas


inerentes as populacoes de interesse.

Busca desenvolver modelos matematicos que possam descrever o comportamento das


caractersticas populacionais ao longo dos tempos.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 22 / 133


Introducao

Aplicacao

MARKETING, PESQUISA DE OPINIAO, SATISFACAO, ELEITORAL,


ENDO-MARKETING, RECURSOS HUMANOS.

Pesquisa qual o publico alvo e como desenvolver meios que permitam influenciar clientes a
adquirirem seus produtos.

Busca verificar a proporcao de pessoas favoraveis a um determinado candidato, projeto,


atendimento, etc..

Desenvolver modelos matematicos que possibilitem entender, tomar decisoes e elaborar


planos de melhorias nas mais diversas atreas das empresas.
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 23 / 133


Introducao

Populacao e Amostra

Figura: Conjunto de pessoas

Populacao e um conjunto de pessoas, objeto ou elementos que apresenta pelo menos uma
caracterstica em comum. E denotada pela letra N.
figuras/ufrn
Amostra e um subconjunto da populacao. E denotada pela letra n. Para se obter amostras de
populacoes, deve-se fazer uso tecnicas amostrais.
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 24 / 133
Introducao

Populacao e Amostra

Figura: Conjunto de pessoas

Populacao e um conjunto de pessoas, objeto ou elementos que apresenta pelo menos uma
caracterstica em comum. E denotada pela letra N.
figuras/ufrn
Amostra e um subconjunto da populacao. E denotada pela letra n. Para se obter amostras de
populacoes, deve-se fazer uso tecnicas amostrais.
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 24 / 133
Introducao

Amostragem
Uma area importante em muitas aplicacoes Estatsticas e a da Tecnologia de Amostragem.

Figura figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 25 / 133


Introducao

Amostragem

figuras/ufrn
Figura
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 26 / 133
Introducao

Amostragem

figuras/ufrn
Figura
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 27 / 133
Introducao

Estatstica e Parametro

Estatstica e uma caracterstica numerica da amostra.

Exemplo:
Proporcao de pessoas a partir de uma amostra, favoraveis a um determinado projeto, apresentado
pela prefeitura de Joao Pessoa.

Parametro e um caracterstica numerica da populacao.

Exemplo:
Proporcao de pessoas favoraveis a um determinado projeto, apresentado pela prefeitura de Joao
figuras/ufrn
Pessoa.
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 28 / 133
Introducao

Estatstica descritiva e inferencial

A estatstica descritiva ocupa-se em coletar, organizacao, analise, sumarizacao, interpretacao


e apresentacao de dados atraves de ferramentas adequadas.

A estatstica inferencial busca analisar a veracidade de uma certa hipotese e tirar conclusoes
figuras/ufrn

sobre determinada caraterstica populacional usando como base de decisao os dados amostrais.
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 29 / 133
Introducao

Series de dados estatsticos

E uma forma de apresentacao de informacoes em forma de tabelas, com objetivo de sintetizar


os dados observados. De um modo geral, uma serie estatstica e uma sequencia de valores que
expressa informacoes sobre uma variavel.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 30 / 133


Introducao

Series de dados estatsticos


1. Historica, Cronologica ou Temporal
As observacoes sao obtidas a partir de uma epoca de ocorrencia. Ou seja, e identificada
pelo fato de os dados seguirem uma ordem cronologica. Perceba que o tempo esta variando,
permanecendo fixos o espaco e a especie do fenomeno estudado
Exemplo

Tabela: Preco do acem no varejo, Sao Paulo - 1989 - 1994.


Ano Variacao percentual
1989 2,24
1990 2,73
1991 2,12
1992 1,89
1993 2,04
1994 2,62
figuras/ufrn
Fonte: APA .

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 31 / 133


Introducao

Series de dados estatsticos


2. Geografica
A variavel de interesse e a localidade (fator geografico), ou seja, os dados sao coletados tomando-
se em consideracao o local de ocorrencia do evento. Neste caso, varia o espaco, permanecendo
fixos o tempo e a especie do fenomeno estudado.
Exemplo

Tabela: Necessidades medias de energia em alguns pases, em 1973.

Pas kcal/per capta/dia


Brasil 2.174
Estados Unidos 2.397
Etiopia 2.120
Japao 1.125
Mexico 2.114 figuras/ufrn

Fonte: Necessidades humanas de energia = IBGE .


Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 32 / 133
Introducao

Series de dados estatsticos


3. Especifica, por categoria ou especificativa
E caracterizada pela especificacao da variavel. Ou seja, agrupam-se os dados conforme a
caracterstica de ocorrencia. Temos a especie variando, permanecendo fixos o tempo e o espaco
do fenomeno estudado.
Exemplo

Tabela: Numero de veculos(por categoria) que trafegaram na Rua das Castanholas, na cidade de
Campina Grande, no mes de marco de 2015.
Tipo de Veculo Numero de veculos
Automovel de passeio 2.000
Caminhao 1.000
Onibus 400
Motocicleta 5.000
figuras/ufrn
Total 8.400
Fonte: Dados hipoteticos .
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 33 / 133
Introducao

Series de dados estatsticos


4. Mista
E caracterizada pela combinacao de uma ou mais tipos de series. Aqui temos um caso em que
mais de um fator varia.
Exemplo

Tabela: Veculos adquirido por regioes/2001

Regioes
Veculos Norte Nordeste Centro Oeste Sul Sudeste Total
Kombi 87 58 79 51 36 311
Cora 56 71 86 88 92 393
Ka 93 84 71 81 62 391
Scort 48 76 90 75 81 370
Fonte: Secretaria de Transportes. figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 34 / 133


Introducao

Variaveis

Figura: Ilustracao

Definicao
figuras/ufrn
E uma caracterstica inerente a populacao, que varia entre os elementos do conjunto.
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 35 / 133
Introducao

Variaveis

Qualitativa nominal
Exemplo
Estado civil (casado, solteiro, viuvo)
Genero (masculino, feminino)
Cor dos olhos (castanhos, preto, azul, verde)

Qualitativa ordinal
Exemplo
Classe social (A, B , C1 , C2 , D)
Grau de instrucao (fundamental, medio, superior)
Pressao sangunea (baixa, normal, alta)
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 36 / 133


Introducao

Variaveis

Quantitativa discreta
Exemplo
Numero de acidentes (0, 1, 2, 3, )
Saldo de gols (10, 9, , 0, 1, 2, 3, )
Numero de ligacoes telefonicas (0, 1, 2, 3, )

Quantitativa contnua
Exemplo
Peso (1,1kg, 2,3Kg, 5,6Kg )
Altura (1,65cm, 1,76cm, 1,80cm)
Distancia (1,1m, 1,5m, 50,6m,)
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 37 / 133


Distribuicao de frequencia

Resumo de dados

Tabela: Informacoes sobre estado civil, grau de instrucao, numero de filhos, salario (expresso com fracao
do salario mnimo), idade (media em anos e meses) e procedencia dos 36 empregados da secao de
orcamento da companha MB.
Idade
Numero de Estado Grau de Numero de Salario Ano Meses Regiao de
Idade
entrevistados civil Instrucao filhos (fracao de R$) Ano Meses procedencia
1 Solteito Fundamental - 4,00 26 3 Interior
2 Casado Fundamental 1 4,56 32 10 Capital
3 Casado Fundamental 2 5,25 26 5 Capital
4 Solteito Medio - 5,73 20 10 Outra
5 Solteito Fundamental - 6,26 40 7 Outra
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
32 Casado Medio 1 16,61 36 4 Interior
33 Casado Superior 3 17,76 43 7 Capital
34 Solteito Superior - 18,75 33 7 Capital
35 Casado Medio 2 19,40 48 11 Capital figuras/ufrn
36 Casado Superior 3 23,30 42 2 Interior
Fonte: Dados hipoteticos.
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 38 / 133
Distribuicao de frequencia

Resumo de dados

1 A forma como os dados estao dispostos tabela anterior sao de certa maneira pouco
informativos.

2 A medida que a dimensao da amostra cresce, torna-se mais inviavel a leitura da tabela.

Como deveremos proceder para resolver esse problema?

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 39 / 133


Distribuicao de frequencia

Distribuicao de frequencias

O maior interesse do pesquisador no estudo de variaveis, e conhecer o comportamento das


variaveis, analisando a ocorrencias de suas possveis realizacoes.
A partir de agora, veremos como proceder para dispor um conjunto de realizacoes, para que se
tenha uma ideia global sobre elas, ou seja de sua distribuicao.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 40 / 133


Distribuicao de frequencia

Distribuicao de frequencias

Tabela: Distribuicao de frequencias da variavel grau de instrucao, usando os dados tabela 2.1

Grau de instrucao Frequencia fi Frequencia fri Frequencia fri %


Fundamental 12 0,3333 33,33
Medio 18 0,5000 50,00
Superior 6 0,1667 16,67
Total 36 1 100
Fonte: Dados hipoteticos.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 41 / 133


Distribuicao de frequencia

Distribuicao de frequencias

Tabela: Frequencias e porcentagens dos 2.000 empregados da Companhia MB, segundo o grau de
instrucao.

Grau de instrucao Frequencia fi Frequencia fri Frequencia fri %


Fundamental 650 0,3250 32,50
Medio 1..020 0,5100 51,00
Superior 330 0,1650 16,50
Total 2.000 1 100
Fonte: Dados hipoteticos.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 42 / 133


Distribuicao de frequencia

Distribuicao de frequencias

Tabela: Distribuicao de frequencias da variavel grau de instrucao, usando os dados tabela 2.1

Grau de instrucao Frequencia fi Frequencia fri Frequencia fri %


Fundamental 12 0,3333 33,33
Medio 18 0,5000 50,00
Superior 6 0,1667 16,67
Total 36 1 100
Fonte: Dados hipoteticos.

Tabela: Frequencias e porcentagens dos 2.000 empregados da Companhia MB, segundo o grau de
instrucao.

Grau de instrucao Frequencia fi Frequencia fri Frequencia fri %


Fundamental 650 0,3250 32,50
Medio 1..020 0,5100 51,00
Superior 330 0,1650 16,50 figuras/ufrn
Total 2.000 1 100
Fonte: Dados hipoteticos.
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 43 / 133
Distribuicao de frequencia

Distribuicao de frequencias

Percebam que se fossemos usar o mesmo procedimento para a construcao de tabelas de


frequencias para as variaveis quantitativas, deveramos tomar alguns cuidados. Sendo assim,
veremos um procedimento para a construcao de tabelas.

1 A tabela e uma forma pratica e clara de apresentar informacoes a partir dos dados
coletados;
2 Para a construcao de tabelas, devemos seguir normas tecnicas, determinadas pelo IBGE;

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 44 / 133


Distribuicao de frequencia

Distribuicao de frequencias por valores


Deve ser construda levando-se em consideracao todos os diferentes valores ou categorias,
observando suas respectivas repeticoes.

Tabela: Frequencias e percentuais dos empregados da Companhia Milsa, segundo o numero de filhos

N de filhos Empregados fi Frequencia fri Frequencia fri %


0 4 0,2 20
1 5 0,25 25
2 7 0,35 35
3 3 0,15 15
5 1 0,05 5
Total 20 1 100
Fonte: Quadro 1.1. figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 45 / 133


Distribuicao de frequencia

Distribuicao de frequencias por valores

Tabela: Frequencias e Percentuais dos 36 empregados da Companhia Milsa , segundo o grau de


educacao.

Grau de instrucao Frequencia fi Frequencia fri Frequencia fri %


Fundamental 12 0,3333 33,33
Medio 18 0,5 50
Superior 6 0,1667 16,67
Total 36 1 100
Fonte: Quadro 1.1.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 46 / 133


Distribuicao de frequencia

Distribuicao de frequencias por intervalo ou classes


A classes de valores sao construdas levando em consideracao o numero de valores que
pertencem a cada classe e quando a variabilidade dos dados e grande.

Tabela: Frequencias e percentuais dos Salarios de 36 empregados da Secao de Orcamento da


Companhia Milsa

Classe de salarios Empregados fi fri i %


4,00 ` 8,00 10 27,78
8,00 ` 12,00 12 33,33
12,00 ` 16,00 8 22,22
16,00 ` 20,00 5 13,89
20,00 ` 24,00 1 2,78
P
Total ou 36 100
figuras/ufrn
Fonte: Quadro 1.1.
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 47 / 133
Distribuicao de frequencia

Construcao de tabelas
Elementos essenciais

figuras/ufrn
Figura: Tabela para especificacao dos elementos essenciais

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 48 / 133


Distribuicao de frequencia

Regras basicas para a construcao de tabelas

1 Constroi-se um ROL ESTATISTICO;


2 Encontra-se a AMPLITUDE TOTAL;

AT = Xmax Xmin
3 Escolhe-se convenientemente o numero de classes K (no inteiro) ou calcula

K
= n, n 25 ou
Formula Sturges K
= 1 + 3, 3.logn, n 25
4 Determinar a amplitude total do intervalo
AT
h=
K
figuras/ufrn

5 Efetua-se o AGRUPAMENTO EM CLASSES


Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 49 / 133
Distribuicao de frequencia

Regras basicas para a construcao de tabelas

Exemplo
Elabore uma tabela de distribuicao de frequencias (dados agrupados) da variavel PESO (em
kg) de uma amostra de 40 estudantes regularmente matriculado na Universidade Federal da
Paraba - UFPB - Per: 2017.1.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 50 / 133


Distribuicao de frequencia

Conceitos essenciais

LIMITES DE CLASSES
Li : Limite inferior de classe ; Ls : Limite superior de classe
AMPLITUDE DE CLASSE

hi = Ls Li
PONTO MEDIO DE CLASSE

Ls + Li
Si =
2
FREQUENCIA SIMPLES OU ABSOLUTA DE CLASSE
n
X
fi = n figuras/ufrn
i=1

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 51 / 133


Distribuicao de frequencia

Conceitos essenciais
FREQUENCIA RELATIVA E PERCENTUAL DE CLASSE
FREQUENCIA RELATIVA
fi
fri =
n
FREQUENCIA PERCENTUAL

fi
fri % = .100%
n
FREQUENCIA SIMPLES ACUMULADA (do tipo abaixo de)

Fi = f1 + f2 + + fi
FREQUENCIA RELATIVA E PERCENTUAL ACUMULADA

figuras/ufrn
Fri = fr 1 + fr 2 + + fri e Fri % = fr 1 % + fr 2 % + + fri %
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 52 / 133
Distribuicao de frequencia

Exemplo
Em uma industria petroqumica foram coletadas amostras periodicamente na estacao de
tratamento e efluentes, afim controla-los quanto a variavel concentracao de amonia. Foram os
seguintes resultados em miligramas por litro.

Tabela: Valores de amonia em miligramas por litro encontradas na estacao de efluentes.


53 48 50 47 46 55 62 54
58 40 36 65 39 43 38 40
60 50 70 36 63 48 49 57
35 41 48 54 60 66 72 56

1 Determinar e comentar sobre:


1 A distribuicao de frequencias; figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 53 / 133


Distribuicao de frequencia

ROL

35 36 36 38 39 40 40 41
43 46 47 48 48 48 49 50
50 53 54 54 55 56 57 58
60 60 62 63 65 66 70 72

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 54 / 133


Distribuicao de frequencia

Tabela: Distribuicao de frequencias da variavel concentracao de amonia, de amostras coletadas, na


estacao de tratamento e efluentes de uma industria petroqumica.

Controle de Amonia fi Fi fri fri (%) Fri (%) Si


35,00 ` 41,20 8 8 0,25 25 25 38,1
41,20 ` 47,40 3 11 0,09 9 34 44,3
47,40 ` 53,60 7 18 0,22 22 56 50,5
53,60 ` 59,80 6 24 0,19 19 75 56,7
59,80 ` 66,00 5 29 0,16 16 91 62,9
66,00 ` 72,20 3 32 0,09 9 100 69,1
Total 32 1,00 100
Fonte: Industria Petroqumica
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 55 / 133


Distribuicao de frequencia

Representacao grafica

Uma das formas de apresentar dados estatsticos e atraves de graficos, cujo objetivo e tornar a
leitura facil do fenomeno em estudo.
Para que possamos realizar uma leitura grafica, deve-se estabelecer uma correspondencia entre
os termos da serie e determinada figura geometrica, de modo que cada elemento da serie seja
representada por uma figura proporcional.

REQUISITOS
Simplicidade
Clareza
Veracidade

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 56 / 133


Distribuicao de frequencia

Representacao grafica

Os graficos podem ser cartogramas ou diagramas. Identifiquemos cada um deles:


1 Cartogramas - sao mapas geograficos ou topograficos em que as frequencias das
categorias de uma variavel sao projetadas nas areas especficas do mapa, utilizando-se
cores ou tracados cujos significados constam em legendas anexadas as figuras.

2 Diagramas - sao graficos em que a magnitude das frequencias e representada por certa
mensuracao de uma determinada figura geometrica. Sao os graficos mais usados na
representacao de series estatsticas e se apresentam atraves de uma grande variedade de
tipos.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 57 / 133


Distribuicao de frequencia

Representacao grafica

Tipos de Diagramas:
Graficos em Linhas - Sao frequentemente usados para a representacao de series temporais.

Graficos Pictoricos (Pictogramas) - Sao graficos construdos a partir de figuras ou


conjunto de figuras representativas da intensidade ou das modalidades do fenomeno.

Graficos em Barras - Tem por finalidade comparar grandezas, por meio de retangulos de
igual largura e alturas proporcionais as respectivas grandezas.

Graficos em Colunas - Idem ao caso anterior.

Graficos em Setores ou Pizza- Sao utilizados para representar valores absolutos ou


porcentagens complementares.
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 58 / 133


Distribuicao de frequencia

Representacao grafica
Cartogramas

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 59 / 133


Distribuicao de frequencia

Representacao grafica
Linhas

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 60 / 133


Distribuicao de frequencia

Representacao grafica
Pictograma

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 61 / 133


Distribuicao de frequencia

Representacao grafica
Barras ou Colunas

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 62 / 133


Distribuicao de frequencia

Representacao grafica
Setores ou Pizza

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 63 / 133


Distribuicao de frequencia

Representacao grafica
Pontos e de Dispersao

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 64 / 133


Distribuicao de frequencia

Representacao grafica
Construcao do grafico de setores ou pizza.
O calculo do angulo correspondente a cada categoria da variavel e feito atraves de regra de tres
simples da seguinte forma:

total 360
parte x

Exemplo

Tabela: Receita do Municpio X de 1975 a 1977.


Anos Receita (em R$ 1.000.000,00)
1975 90
1976 120
1977 150 figuras/ufrn

Total 360
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 65 / 133
Distribuicao de frequencia

Representacao grafica

Figura: Grafico de Setores figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 66 / 133


Distribuicao de frequencia

Representacao grafica

GRAFICOS REPRESENTATIVOS DAS DISTRIBUICOES DE FREQUENCIA

Histograma - E um grafico formado por um conjunto de retangulos justapostos, de forma


que a area de cada retangulo seja proporcional a frequencia da classe que ele representa.

Polgonos de Frequencia - Unindo por linhas retas os pontos medios das bases superiores
dos retangulos do histograma, obtem-se outra representacao dos dados, denominada
polgono de frequencia.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 67 / 133


Distribuicao de frequencia

Representacao grafica

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 68 / 133


Distribuicao de frequencia

Ramo e Folhas
Um diagrama de ramos e folhas e uma maneira para representar os dados quantitativos
graficamente, semelhante a um histograma, que ajuda a visualizar a forma de uma distribuicao.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 69 / 133


Distribuicao de frequencia

Ramo e Folhas

Exemplo

Tabela: Salarios dos 36 funcionarios da secao de orcamento da Companhia MB (Tabela 2.1)

4,00 4,56 5,25 5,73 6,26 6,66 6,86 7,39 7,59 7,44 8,12 8,46
8,74 8,95 9,13 9,35 9,77 9,80 10,53 10,76 11,06 11,59 12,00 12,79
13,23 13,60 13,85 14,69 14,71 15,99 16,22 16,61 17,26 18,75 19,40 23,30

A ideia consiste em dividir cada uma das observacoes em duas partes: a primeira (o ramo) e
colocada a esquerda de uma linha vertical, a segunda (a folha) e colocada a direita da linha.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 70 / 133


Distribuicao de frequencia

Ramo e Folhas

Tabela: Ramo-e-folhas para a variavel S: salarios


4 00 56
5 25 73
6 26 66 86
7 39 44 59
8 12 46 74 95
9 13 35 77 80
10 53 76
11 06 59
12 00 79
13 23 60 85
14 69 71
15 99
16 22 61
17 26
18 75
19 40
20
21
22 figuras/ufrn
23 30

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 71 / 133


Distribuicao de frequencia

Ramo e Folhas
Exemplo

Tabela: Dureza de 30 pecas de alumnio (Hoaglin, Mosteller e Tukey, pag. 13).

53,0 70,2 84,3 69,5 77,8 87,5 53,4 82,2 67,3 54,1
70,5 71,4 95,4 51,1 74,4 55,7 63,5 85,8 53,5 64,3
82,7 78,5 55,7 69,1 72,3 59,5 55,3 73 52,4 50,7

Tabela: Ramo-e-folhas para os dados de dureza de pecas de alumnio.

5 0 1 2 3 3 3 4 5 5 9
6 3 4 7 9 9
7 0 0 1 2 3 4 7 8
8 2 2 4 5 7 figuras/ufrn

9 5
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 72 / 133
Distribuicao de frequencia

Intervalos de classes desiguais

Tabela: Distribuicao de frequencias de 250 empregados classificados segundo numero de empregados.

Numero de empregados fi Amplitude i Densidade fi /i Proporcao fri Densidade fri /i


0 ` 10 5 10 0,50 0,02 0,0020
10 ` 20 20 10 2,00 0,08 0,0080
20 ` 30 35 10 3,50 0,14 0,0140
30 ` 40 40 10 4,00 0,16 0,0160
40 ` 60 50 20 2,50 0,20 0,0100
60 ` 80 30 20 1,50 0,12 0,0060
80 ` 100 20 20 1,00 0,08 0,0400
100` 140 20 40 0,50 0,08 0,0020
140` 180 15 40 0,38 0,06 0,0015
180` 260 15 80 0,19 0,06 0,0008
Total 250 - - 1,00 -
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 73 / 133


Distribuicao de frequencia

Interpretacao do grafico de frequencia acumulada

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 74 / 133


Distribuicao de frequencia

Funcao de distribuicao emprica (f.d.e.) Fn (x ) ou F E (x )

N (x )
Fe (x ) = Fn (x ) = , (1)
n
em que,
N (x ) e o numero de de observacoes menores ou igual a x ;
n e o total de observacoes da variavel quantitativa;
x e um numero real qualquer.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 75 / 133


Distribuicao de frequencia

Funcao de distribuicao emprica (f.d.e.) Fn (x ) ou F E (x )

Exemplo
Para a variavel S = salario dos 36 funcionarios da secao de orcamento da companhia Milsa
listados na tabela 2.1, temos a seguinte funcao:




0, se s < 4, 00

1/36,


se 4, 00 s < 4, 56
F36 (s) = 2/36, se 4, 56 s < 5, 25

.. ..



., .

1, se s 23, 30
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 76 / 133


Medidas de resumo

Medidas de posicao

Aprendemos que ao resumirmos os dados atraves de tabelas de frequencias, e muito mais


informativo (comportamento da variavel) do que a tabela original dos dados. Em muitos
casos, e interessante resumir esses dados em unica medida, que possa representar toda a
serie. Ao fazermos essa reducao, estamos obtendo uma reducao drastica dos dados. Em
geral, trabalhamos com as seguintes medidas de posicao: media, mediana e moda.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 77 / 133


Medidas de resumo

Moda

Exemplo

Tabela: Frequencias e percentuais dos empregados da Companhia Milsa, segundo o numero de filhos

N de filhos Empregados fi Frequencia fri Frequencia fri %


0 4 0,2 20
1 5 0,25 25
2 7 0,35 35
3 3 0,15 15
5 1 0,05 5
Total 20 1 100
Fonte: Quadro 1.1.

Definicao
A moda e a realizacao mais frequente num conjunto de valores, podendo ainda ser bimodal,
figuras/ufrn
trimodal, etc.

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 78 / 133


Medidas de resumo

Moda

Exemplo

Tabela: Frequencias e percentuais dos empregados da Companhia Milsa, segundo o numero de filhos

N de filhos Empregados fi Frequencia fri Frequencia fri %


0 4 0,2 20
1 5 0,25 25
2 7 0,35 35
3 3 0,15 15
5 1 0,05 5
Total 20 1 100
Fonte: Quadro 1.1.

Definicao
A moda e a realizacao mais frequente num conjunto de valores, podendo ainda ser bimodal,
figuras/ufrn
trimodal, etc.

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 78 / 133


Medidas de resumo

Mediana

Exemplo
Suponha que em pesquisa foram tomadas as seguintes observacoes: 4, 5, 7, 9 e 8.

Definicao
A mediana e o valor que divide um conjunto de dados em dois subconjuntos de tamanhos
iguais, ou seja, e o elemento que ocupa a posicao central do conjunto de dados. conteudo...

Assim para o exemplo acima, a mediana e o valor 7, correspondendo a terceira observacao.

Quando o numero de observacoes for par, a mediana e o dada pela media aritmetica dos dois
valores centrais do conjunto de dados. figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 79 / 133


Medidas de resumo

Mediana

Exemplo
Suponha que em pesquisa foram tomadas as seguintes observacoes: 4, 5, 7, 9 e 8.

Definicao
A mediana e o valor que divide um conjunto de dados em dois subconjuntos de tamanhos
iguais, ou seja, e o elemento que ocupa a posicao central do conjunto de dados. conteudo...

Assim para o exemplo acima, a mediana e o valor 7, correspondendo a terceira observacao.

Quando o numero de observacoes for par, a mediana e o dada pela media aritmetica dos dois
valores centrais do conjunto de dados. figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 79 / 133


Medidas de resumo

Media aritmetica

Exemplo

Tabela: Frequencias e percentuais dos empregados da Companhia Milsa, segundo o numero de filhos

N de filhos Empregados fi Frequencia fri Frequencia fri %


0 4 0,2 20
1 5 0,25 25
2 7 0,35 35
3 3 0,15 15
5 1 0,05 5
Total 20 1 100
Fonte: Quadro 1.1.

Percebam que a media sera dada por:


40+51+72+33+15
= 1, 65 figuras/ufrn
20
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 80 / 133
Medidas de resumo

Media aritmetica

Exemplo

Tabela: Frequencias e percentuais dos empregados da Companhia Milsa, segundo o numero de filhos

N de filhos Empregados fi Frequencia fri Frequencia fri %


0 4 0,2 20
1 5 0,25 25
2 7 0,35 35
3 3 0,15 15
5 1 0,05 5
Total 20 1 100
Fonte: Quadro 1.1.

Percebam que a media sera dada por:


40+51+72+33+15
= 1, 65 figuras/ufrn
20
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 80 / 133
Medidas de resumo

Formalizacao dos conceitos


Suponha que x1 , x2 , x3 , . . . , xn sao os n valores de uma determinada variavel X.
n
x1 + x2 + x3 , + . . . + xn 1X
x = = xi . (2)
n n
i=1
Suponha agora, que dispomos de n observacoes da variavel X, das quais n1 sao iguais a x1 , n2
a x2 etc., nk iguais a xk . Assim, a media sera dada por
n
n1 x1 + n2 x2 + n3 x3 , + . . . + nk xk 1X
x = = ni xi . (3)
n n
i=1
Mas se fri = fi /n representar a frequencia relativada observacao xi , entao (2) pode ser escrita
como
n n
X 1X
x = fri xi = fi xi (4)
figuras/ufrn
n
i=1 i=1
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 81 / 133
Medidas de resumo

Formalizacao dos conceitos

Suponha que dispomos de observacoes ordenadas em ordem crescente. Considere que as


observacoes estejam denotas por x(1) , x(2) , e assim por diante. Entao

x(1) x(2) x(3) . . . x(n1) x(n) . (5)

Suponha que, x1 = 3, x2 = 2, x3 = 6, x4 = 1, x5 = 3.

2 1 3 3 6.
Assim,

x1 = 2, x2 = 1, x3 = 3, x4 = 3, x5 = 6.
Deste modo, as observacoes em (4) sao denominadas estatsticas de ordem. figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 82 / 133


Medidas de resumo

Formalizacao dos conceitos

Suponha que dispomos de observacoes ordenadas em ordem crescente. Considere que as


observacoes estejam denotas por x(1) , x(2) , e assim por diante. Entao

x(1) x(2) x(3) . . . x(n1) x(n) . (5)

Suponha que, x1 = 3, x2 = 2, x3 = 6, x4 = 1, x5 = 3.

2 1 3 3 6.
Assim,

x1 = 2, x2 = 1, x3 = 3, x4 = 3, x5 = 6.
Deste modo, as observacoes em (4) sao denominadas estatsticas de ordem. figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 82 / 133


Medidas de resumo

Formalizacao dos conceitos

Suponha que dispomos de observacoes ordenadas em ordem crescente. Considere que as


observacoes estejam denotas por x(1) , x(2) , e assim por diante. Entao

x(1) x(2) x(3) . . . x(n1) x(n) . (5)

Suponha que, x1 = 3, x2 = 2, x3 = 6, x4 = 1, x5 = 3.

2 1 3 3 6.
Assim,

x1 = 2, x2 = 1, x3 = 3, x4 = 3, x5 = 6.
Deste modo, as observacoes em (4) sao denominadas estatsticas de ordem. figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 82 / 133


Medidas de resumo

Formalizacao dos conceitos

Suponha que dispomos de observacoes ordenadas em ordem crescente. Considere que as


observacoes estejam denotas por x(1) , x(2) , e assim por diante. Entao

x(1) x(2) x(3) . . . x(n1) x(n) . (5)

Suponha que, x1 = 3, x2 = 2, x3 = 6, x4 = 1, x5 = 3.

2 1 3 3 6.
Assim,

x1 = 2, x2 = 1, x3 = 3, x4 = 3, x5 = 6.
Deste modo, as observacoes em (4) sao denominadas estatsticas de ordem. figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 82 / 133


Medidas de resumo

Formalizacao dos conceitos

Utilizando a notacao acima, podemos definir a mediana como


x n+1 , se n for impar;
( 2 )


md(x)= (6)
x n + x( n +1)
(2)

2
, se n par.

2

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 83 / 133


Medidas de resumo

Exemplo

Tabela: Dados Hipoteticos


(a) Dados observados 1 (b) Dados observados 2
xi fi Fi xi fi Fi
1 1 1 82 5 5
2 3 4 85 10 15
3 5 9 87 15 30
4 2 11 89 8 38
Total 11 90 4 42
Total 42

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 84 / 133


Medidas de resumo

Dados agrupados em classe

Mediana
n
Fi

2
md = limd + h. (7)
fimd

em que:
limd e o limite inferior da classe que contem a mediana;
n2 e a Posicao da mediana;
Fi e a Frequencia acumulada anterior a classe da mediana;
fimd e a frequencia simples da classe da mediana;
h e a amplitude da classe da mediana.
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 85 / 133


Medidas de resumo

Exemplo

Tabela: Dados hipoteticos

Peso (Kg) fi Fi
45 ` 55 5 5
55 ` 65 4 9
65 ` 75 7 16
75 ` 85 11 27
85 ` 95 3 30
Total 30

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 86 / 133


Medidas de resumo

Dados agrupados em classe

Moda
 
d1
mo = li + h. (8)
d1 + d2

em que:
limo e o limite inferior da classe que contem a moda;
d1 e a diferenca entre a frequencia simples da classe modal e da imediatamente anterior;
d2 e a diferenca entre a frequencia simples da classe modal e da imediatamente posterior;;
h e a amplitude da classe modal.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 87 / 133


Medidas de resumo

Exemplo

Tabela: Notas da disciplina de Calculo das Probabilidade e Estatstica I.

Notas fi Fi
3`4 2 2
4`5 3 5
5`6 5 10
6`7 3 13
7 ` 8 10 23
8`9 6 29
9 ` 10 5 34
Total 34
Fonte: Dados hipoteticos
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 88 / 133


Medidas separatrizes

Quartis, decis e percentis

Sao medidas adequadas para representar conjuntos de dados que sao afetados de forma
exagerada por valores extremos e quando tambem se quer ter uma ideia do comportamento
dos dados em relacao a simetria.

figuras/ufrn
Figura: Medidas Separatrizes
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 89 / 133
Medidas separatrizes

Quartis, decis e percentis


Dados agrupados
Dois passos sao necessarios para encontrar as medidas separatrizes:
1 Identificar a sua posicao;

K
L= n,
m
em que
L e o valor que indica a posicao da separatriz;
k e a k-esima separatriz, k = 1, 2, , 99;
m e a quantidade de partes da separatriz, m = 4, 10, 100;
n e o total de observacoes.
2 determinar o seu valor.
Se L nao for inteiro, arredondar para o inteiro seguinte
Se L for inteiro, a k-esima separatriz sera a media aritmetica dos valores que estao na posicao
figuras/ufrn

L e L+1.
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 90 / 133
Medidas separatrizes

Exemplo
Encontre Q1 e Q3 .

Tabela: Numero de filhos por funcionarios de uma empresa.

N de filhos N de funcionarios Fi
0 4 4
1 6 10
2 11 21
3 6 27
4 3 30
Total 30
Fonte: Dados hipoteticos
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 91 / 133


Medidas separatrizes

Dados agrupados em classe


Quartis: Dados agrupados em classe
kn P 
4 Fi .h
Qi = lQi + , i = 1, 2, 3, k = 1, 2, 3. (9)
fQi

em que:
k e o k-esimo quartil;
kn
e a posicao do quartil;
4
lQi e o limite inferior a classe que contem o quartil;
P
Fi e a frequencia acumulada anterior a classe que contem o quartil;
fQi e a frequencia simples da classe que contem o quartil;;
h e a amplitude da classe que contem o quartil;. figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 92 / 133


Medidas separatrizes

Exemplo
Encontre Q2 e Q3 .

Tabela: Notas da disciplina de Calculo das Probabilidade e Estatstica I.

Notas fi Fi
3`4 2 2
4`5 3 5
5`6 5 10
6`7 3 13
7 ` 8 10 23
8`9 6 29
9 ` 10 5 34
Total 34
Fonte: Dados hipoteticos
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 93 / 133


Medidas separatrizes

Dados agrupados em classe

Decis: Dados agrupados em classe


kn P 
10 Fi .h
Di = lDi + , k = 1, 2, 3, . . . , 9 (10)
fDi

em que:
lDi e o limite inferior da classe que contem o decil;
kn
e a posicao do decil;
10
DQi e o limite inferior da classe que contem o decil;
P
Fi e a frequencia acumulada anterior a classe que contem o decil;
fDi e a frequencia simples da classe que contem o decil;
h e a amplitude da classe que contem o decil. figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 94 / 133


Medidas separatrizes

Exemplo
Encontre D6 e D8 .

Tabela: Notas da disciplina de Calculo das Probabilidade e Estatstica I.

Notas fi Fi
3`4 2 2
4`5 3 5
5`6 5 10
6`7 3 13
7 ` 8 10 23
8`9 6 29
9 ` 10 5 34
Total 34
Fonte: Dados hipoteticos
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 95 / 133


Medidas separatrizes

Percentis
kn P 
100 Fi .h
Pi = lpi + , k = 1, 2, 3, . . . , 99 (11)
fpi

em que:
lpi e o limite inferior da classe que contem o percentil;
kn
e a posicao do percentil;
100
P
Fi e a frequencia acumulada anterior a classe que contem o percentil;
fpi e a frequencia simples da classe que contem o percentil;
h e a amplitude da classe que contem o percentil.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 96 / 133


Medidas separatrizes

Exemplo
Encontre P20 e P60 .

Tabela: Notas da disciplina de Calculo das Probabilidade e Estatstica I.

Notas fi Fi
3`4 2 2
4`5 3 5
5`6 5 10
6`7 3 13
7 ` 8 10 23
8`9 6 29
9 ` 10 5 34
Total 34
Fonte: Dados hipoteticos
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 97 / 133


Medidas separatrizes

Formula geral para o calculo da separatriz e dada por:

 
%abaixo da Sep Fant %
Sep = lsep + .hsep (12)
fSep %
em que
lSep e o limite inferior da classe que contem a separatriz;
fsep % e a frequencia percentual da classe que contem a separatriz; ;
Fant % e a frequencia percentual acumulada da classe anterior;
hsep e a amplitude da classe que contem a separatriz.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 98 / 133


Medidas separatrizes

Exemplo
Encontre as separatrizes Q1 , D2 e P3 .

Tabela: Distribuicao de frequencias da variavel peso em Kg

Peso (Kg) fi Fi
45 ` 55 5 5
55 ` 65 4 9
65 ` 75 7 16
75 ` 85 11 27
85 ` 95 3 30
Total 30
Fonte: Dados hipoteticos
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 99 / 133


Medidas de dispersao assimetria e curtose

Sao medidas estatsticas que servem para verificar a representatividade das medidas de
posicao, em torno da media.

Figura: Linha de producao de uma peca

A medida media do comprimento da peca e de 75cm e ambas as linhas estao produzindo pecas
com medias proximas desse valor. Podemos considerar que as pecas produzidas por ambas as
linhas sao adequadas? figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 100 / 133


Medidas de dispersao assimetria e curtose

Amplitude
Exemplo
Considere as seguintes observacoes referentes as 5 notas de 5 alunos da disciplina de calculo
das probabilidades e estatstica I.

Tabela: Notas dos alunos

Grupo A X 3 4 5 6 7
Grupo B Y 1 3 5 7 9
Grupo C Z 5 5 5 5 5
Grupo D W 3 5 5 7
Grupo E V 3 5 5 6 6
Fonte: Dados hipoteticos

figuras/ufrn

H = Xmax Xmin. (13)


Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 101 / 133
Medidas de dispersao assimetria e curtose

Amplitude
Exemplo
Considere as seguintes observacoes referentes as 5 notas de 5 alunos da disciplina de calculo
das probabilidades e estatstica I.

Tabela: Notas dos alunos

Grupo A X 3 4 5 6 7
Grupo B Y 1 3 5 7 9
Grupo C Z 5 5 5 5 5
Grupo D W 3 5 5 7
Grupo E V 3 5 5 6 6
Fonte: Dados hipoteticos

figuras/ufrn

H = Xmax Xmin. (13)


Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 101 / 133
Medidas de dispersao assimetria e curtose

Desvio medio e Variancia

Sao medidas que sumarizam a variabilidade de um conjunto de observacoes, permitindo a


comparacao entre conjuntos diferentes (tabela acima) de valores, de acordo com um
criterio estabelecido.
Sao medidas que medirao a dispersao dos dados em torno da media.

Percebam por exemplo, que o grupo A acima, os desvios xi x sao: 2, 1, 0, 1, 2.


P5
Se tomarmos i=1 (xi x ) = 0.

1 Considerar os desvios em valor absoluto;


2 Considerar a soma dos quadrados das diferencas dos desvios.
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 102 / 133


Medidas de dispersao assimetria e curtose

Desvio medio e Variancia

P5
1 i=1 |xi x | = 2 + 1 + 0 + 1 + 2 = 6
P5
2 i=1 (xi x )2 = 4 + 1 + 0 + 1 + 4 = 10

Vejam que continuamos com dificuldades quando comparamos conjunto de dados diferentes.
Sendo assim, faremos o uso das medias, ou seja, o desvio medio e a variancia.
n
1X
dm(X ) = |xi x | (14)
n
i=1
n
1X
Var (X ) = (xi x )2 (15)
n
i=1
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 103 / 133


Medidas de dispersao assimetria e curtose

Desvio medio e variancia

Para o grupo A temos

dm(X ) = 1, 2
Var (X ) = 2, 0
enquanto para o grupo D temos

dm(W ) = 1, 0
Var (W ) = 2, 0

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 104 / 133


Medidas de dispersao assimetria e curtose

Desvio padrao

p
dp(X ) = Var (X ) (16)

Os desvios medio (dm) e padrao (dp) indicam em media o quanto estara errando (desvio) ao
substituir cada observacao pela medida resumo do conjunto de dados.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 105 / 133


Medidas de dispersao assimetria e curtose

Exemplo
Encontre as medidas de dispersao para a variavel K = numero de filhos, resumida na tabela
abaixo:

Tabela: Frequencias e porcentagens dos empregados da secao de orcamentos da Companhia Milsa MB,
segundo o numero de filhos.
N de filhos N de funcionarios Fi
0 4 20
1 5 25
2 7 35
3 3 15
5 1 5
Total 20 100
Fonte: Tabela 1

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 106 / 133


Medidas de dispersao assimetria e curtose

Vamos imaginar que temos n1 obervacoes dos valores de x1 ,. . . , nk observacoes de xk da variavel


X. Entao,
Pk k
i=1 fi |xi x | X
dm(X ) = = fri |xi x | , (17)
n
i=1
Pk k
i=1 fi (xi x )2 X
Var (X ) = = fri (xi x )2 , (18)
n
i=1
p
dp(X ) = Var (X ). (19)

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 107 / 133


Medidas de dispersao assimetria e curtose

Uma maneira computacionalmente mais eficiente de calcular a variancia e dada por


Pn
x2
Var (X ) = i=1 i x 2 , (20)
n
e, no caso de observacoes repetidas,
n
X
Var (X ) = fri xi2 x 2 . (21)
i=1

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 108 / 133


Medidas de dispersao assimetria e curtose

Variancia populacional
N
X (xi )2
2 = (22)
N
i=1

Variancia amostral
n
2
X (xi x )2
s = (23)
n 1
i=1

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 109 / 133


Medidas de dispersao assimetria e curtose

Desvio padrao populacional


v
uN
uX (xi )2
2
= =t (24)
N
i=1

Desvio padrao amostral


v
u n
uX (xi x )2
s= 2
s =t (25)
n 1
i=1

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 110 / 133


Medidas de dispersao assimetria e curtose

Coeficiente de variacao

e uma medida relativa de dispersao, util pra a comparacao em termos relativos do grau de
concentracao em torno da media de series distintas.
s
CV = , (26)
x
em que
1 s e o desvio padrao
2 x e a media dos dados
3 CV e o coeficiente de variacao
Para comparacao entre dois conjuntos de observacoes, tomaremos as seguinte expressao:
s
CV = .100%, (27)
x figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 111 / 133


Medidas de dispersao assimetria e curtose

Exemplo
Numa empresa, o salario medio dos homens e de R$ 4.000,00, com desvio-padrao de R$
1.500,00, e o das mulheres e em media de R$ 3.000,00, com desvio-padrao de R$ 1.200,00.

s
CVh = .100% = 37, 5%,
x
s
CVm = .100% = 40%.
x

Logo, podemos concluir que os salarios das mulheres apresentam maior dispersao que os dos
homens.
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 112 / 133


Medidas de dispersao assimetria e curtose

Exemplo
Numa empresa, o salario medio dos homens e de R$ 4.000,00, com desvio-padrao de R$
1.500,00, e o das mulheres e em media de R$ 3.000,00, com desvio-padrao de R$ 1.200,00.

s
CVh = .100% = 37, 5%,
x
s
CVm = .100% = 40%.
x

Logo, podemos concluir que os salarios das mulheres apresentam maior dispersao que os dos
homens.
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 112 / 133


Medidas de dispersao assimetria e curtose

Assimetria

Em uma distribuicao simetrica, a media, moda e mediana tomam valores iguais, enquanto os
quartis ficam equidistantes da mediana, o que nao ocorre numa distribuicao assimetrica.

figuras/ufrn

Figura: Representacao de dados segundo a assimetria


Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 113 / 133
Medidas de dispersao assimetria e curtose

Coeficiente de assimetria

Caso I
Quando dispomos de valores da media e do desvio-padrao devemos utilizar o:

PRIMEIRO COEFICIENTE DE PEARSON


x mo
As = (28)
s

Caso II
Quando nao dispomos de valores da media e do desvio-padrao devemos utilizar o:

SEGUNDO COEFICIENTE DE PEARSON

Q3 + Q1 2md
As = (29)
Q3 Q1 figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 114 / 133


Medidas de dispersao assimetria e curtose

Com base no valor de As devemos tirar as seguintes conclusoes:

1 Se As = 0 a distribuicao e simetrica.
2 Se As > 0 a distribuicao e assimetria positiva.
3 Se As < 0 a distribuicao e assimetria negativa.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 115 / 133


Medidas de dispersao assimetria e curtose

Exemplo
Considere a distribuicao amostral abaixo:

Tabela: Notas do Teste de Raciocnio Logico do Grupo B.

Notas fi fri Fi Si
10 ` 14 10 0,08 10 12
14 ` 18 20 0,18 30 16
18 ` 22 30 0,25 60 20
22 ` 26 50 0,41 110 24
26 ` 30 10 0,08 120 41
Total 120 1,00
Fonte: Dados hipoteticos
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 116 / 133


Medidas de dispersao assimetria e curtose

obs.: CONFERIR OS RESULTADOS


n
X
x = Si .fri = 21, 96
i=1

d1 = 50 30 = 20
d2 = 50 10 = 40
 
20
mo = 22 + .4 = 23, 33.
20 + 40
v
u n
1 X
fi (Si x )2 = 4, 16
u
s=t
n 1
i=1

21, 96 23, 33 figuras/ufrn


Logo, As = = 0, 329. Conclumos que a curva e assimetrica e esquerda.
4, 16
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 117 / 133
Medidas de dispersao assimetria e curtose

Curtose
Curtose e o grau de achatamento de uma distribuicao. De acordo com o grau de achatamento,
podemos ter:

Figura: Classificacao da distribuicao segundo o grau de achatamento. figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 118 / 133


Medidas de dispersao assimetria e curtose

Curtose
Curtose e o grau de achatamento de uma distribuicao. De acordo com o grau de achatamento,
podemos ter:

Figura: Classificacao da distribuicao segundo o grau de achatamento. figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 118 / 133


Medidas de dispersao assimetria e curtose

Coeficiente de curtose

Q3 Q1
K = (30)
2(P90 P 10)

1 Se K = 0, 263, diremos que a curva correspondente a distribuicao de frequencia e


mesocurtica.
2 Se K > 0, 263, diremos que a curva correspondente a distribuicao de frequencia e
platicurtica.
3 Se K < 0, 263, diremos que a curva correspondente a distribuicao de frequencia e
leptocurtica.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 119 / 133


Medidas de dispersao assimetria e curtose

Exemplo
Classifique a curva correspondente a distribuicao do conjunto de dados da tabela.

Tabela: Intervalo de salarios das famlias dos alunos da disciplina de Calculo das Probabilidade e
Estatstica I.

Salarios fi Fi
3`8 5 5
8 ` 13 15 20
13 ` 18 20 40
18 ` 23 10 50
Total 50
Fonte: Dados hipoteticos

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 120 / 133


Medidas de dispersao assimetria e curtose

50

5 .5 4
Q1 = 8 + = 10, 5,
15
350

4 5 .5
Q3 = 13 + = 17, 38,
20
1050

100 0 .5
P10 = 3 + = 8,
5
9050

100 40 .5
P90 = 18 + = 20, 5.
5
Portanto,
17, 38 10, 5
K = = 0, 27.
2 (20, 5 8)
figuras/ufrn
Como K = 0, 27 > 0, 263, a curva e suavemente platicurtica.
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 121 / 133
Medidas de dispersao assimetria e curtose

Box-plot

figuras/ufrn
Figura: Box-plot ou diagrama de caixa

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 122 / 133


Medidas de dispersao assimetria e curtose

figuras/ufrn

Figura: diagrama de caixa ou Box-plot


Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 123 / 133
Medidas de dispersao assimetria e curtose

figuras/ufrn
Figura: diagrama de caixa ou Box-plot
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 124 / 133
Medidas de dispersao assimetria e curtose

figuras/ufrn

Figura: Box-plot dos funcionarios da MB, segundo o genero e o salario.


Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 125 / 133
Medidas de dispersao assimetria e curtose

Exemplo
Em uma industria petroqumica foram coletadas amostras periodicamente na estacao de
tratamento e efluentes, afim controla-los quanto a variavel concentracao de amonia. Foram os
seguintes resultados em miligramas por litro.

Tabela: Valores de amonia em miligramas por litro encontradas na estacao de efluentes.


53 48 50 47 46 55 62 54
58 40 36 65 39 43 38 40
60 50 70 36 63 48 49 57
35 41 48 54 60 66 72 56

1 Determinar e comentar sobre:


1 A distribuicao de frequencias;
2 Media, moda e mediana;
figuras/ufrn
3 Construir um grafico;
4 Calcular o segundo quartil e o terceiro percentil e interpretar.
Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 126 / 133
Medidas de dispersao assimetria e curtose

ROL

35 36 36 38 39 40 40 41
43 46 47 48 48 48 49 50
50 53 54 54 55 56 57 58
60 60 62 63 65 66 70 72

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 127 / 133


Medidas de dispersao assimetria e curtose

Exemplo
Uma instituicao financeira (IF) utiliza um indicador do grau de endividamento para avaliar a
situacao de suas carteiras de emprestimo. O indicador e calculado para cada participante da
carteira e, grosseiramente, quanto maior o valor do indicador, pior e a situacao do cliente. A IF
esta interessada em descrever a situacao de duas carteiras distintas:
Carteira Alfa - com emprestimos concedidos em 2012 e
Carteira Beta - com emprestimos concedidos em 2013.

Ela conta com uma amostra de 500 clientes de cada carteira. As Tabelas 1 e 2 resumem os
resultados desta pesquisa.

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 128 / 133


Medidas de dispersao assimetria e curtose

Tabela: Distribuicao de frequencias e densidades de frequencia do grau de endividamento de clientes


das carteiras Alfa e Beta.

Grau de Endividamento fi Fi Grau de Endividamento fi Fi


0`5 61 61 0`5 55 55
5 ` 10 107 168 5 ` 10 83 138
10 ` 15 97 265 10 ` 15 79 217
15 ` 20 77 342 15 ` 20 77 294
20 ` 30 77 419 20 ` 30 75 369
30 ` 50 63 482 30 ` 50 100 469
50 ` 75 18 500 50 ` 100 31 500
Total 500 Total 500
(a) Dados observados 1 (b) Dados observados 2
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 129 / 133


Medidas de dispersao assimetria e curtose

Exemplo
(Bussab, Wilton de O., Pedro A. Morettin, Estatstica basica - 5. ed.) Em uma granja foi
observada a distribuicao dos frangos em relacao ao peso,que era seguinte:

Tabela: Distribuicao de frequencias dos pesos de frangos de uma granja .


Pesos (Kg) fi Fi fri
960 ` 980 60 60
980 ` 1.000 160 220
1.000 ` 1.020 280 500
1.020 ` 1.040 260 760
1.040 ` 1.060 160 920
1.060 ` 1.080 80 1000
Total 1000
Fonte: Dados hipoteticos

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 130 / 133


Medidas de dispersao assimetria e curtose

1 Pede-se:
A media e variancia da distribuicao;
Histograma
Queremos dividir os frangos em quatro categorias, em relacao ao peso, de modo que:

Os 20% mais leve seja da categoria D;


Os 30% seguintes sejam da categoria C;
Os 30% seguintes sejam da categoria B;
Os 20% seguintes (ou seja, os 20% mais pesados) sejam da categoria A.
O granjeiro decide separar deste lote os animais com peso inferior a dois desvios padroes abaixo
da media para receberem racao reforcada, e tambem separar oa animais com peso superior a um
desvio padrao acima da media para usa-los como reprodutores.

1 Quais os limites de peso entre as categorias A, B, c e D?


2 Qual a porcentagem de animais que serao separados em cada caso?
figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 131 / 133


Medidas de dispersao assimetria e curtose

Exemplo
(Bussab, Wilton de O., Pedro A. Morettin, Estatstica basica - 5. ed.) A idade media dos
candidatos a um determinado curso de aperfeicoamento sempre foi baixa, da ordem de 22 anos.
Como esse curso foi planejado para atender a todas as idades, decidiu-se fazer uma campanha
de divulgacao. Para se verificar se a campanha foi ou nao eficiente, fez-se um levantamento da
idade dos candidatos a ultima promocao, e os resultados estao na tabela a seguir.

Tabela: Distribuicao de frequencias das idades dos candidatos a um determinado curso de


aperfeicoamento .
Idade fi Fi fri
18 ` 20 18 18
20 ` 22 12 30
22 ` 26 10 40
26 ` 30 8 48
30 ` 36 2 50
Total 50 figuras/ufrn

Fonte: Dados hipoteticos


Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 132 / 133
Medidas de dispersao assimetria e curtose

Pede-se
1 Baseado nesses resultados, voce diria que a campanha produziu algum efeito (isto e,
aumentou a idade media)?
2 Histograma e discuta pontos interessantes;
3 Um outro pesquisador decidiu usar a seguinte regra: se a diferenca x 22 fosse maior que o

valor 2dp(X )/ n, entao a campanha teria surtido efeito. Qual a conclusao dele, baseada
nos dados?

figuras/ufrn

Fabio Azevedo Aula de Estatstica Descritiva 18 de setembro de 2017 133 / 133