Introdução À Estatística Descritiva AP3a

Prof. Renaldo A.
GonsalvesPontifícia Universidade Católica de São Paulo

Notas Preliminares de Aula
Distribuições de Frequências ou Intervalo de classes.
As distribuições de frequências são utilizadas quando desejamos resumir grandes

volumes de dados (que extraídos da população ou de uma amostra). O agrupamento dos
dados em classes permite compreender algumas características da população analisada.
A descoberta de padrões, ou de características das populações (ou amostras), a partir da

organização por intervalos de classes, é extremamente útil para compreender uma
realidade ou servir de apoio no processo de tomada de decisão gerencial.
Outro uso para as distribuições de frequência organizadas por intervalos de classe é a

possibilidade de identificar uma distribuição teórica chamada de “curva normal” ou
curva de gauss (gráfico em forma de sino). Esta distribuição é muito aplicada em
estudos e pesquisas.
Suponha que um instituto de pesquisa aplicou 16.000 questionários na cidade de São

Paulo, com objetivo de compreender o comportamento do consumidor paulistano, ou
uma empresa retirou uma amostra de 800 peças da sua linha de produção para fazer o
controle de qualidade através de testes não destrutivos. O simples exame destes dados,
ou apenas a confecção de indicadores de posição central e de dispersão, podem não
revelar muita informação.
A organização destes dados distribuídos por frequência em intervalos de classe é a

ferramenta adequada para esta abordagem.
A subjetividade para estabelecer o número de classes:

ou critérios para organizar os dados.
Suponha que o pesquisador do instituto de pesquisa, ao examinar a base de dados, tenha

a intenção de distribuir os consumidores paulistanos em duas classes de renda. A
primeira se chamará – “renda baixa” e a outra “renda alta”.
E para fazer o primeiro ensaio resolveu retirar uma sub amostra aleatória de 45
questionários com declaração de renda mensal como proporção do salário mínimo
(SM).
Renda em salários mínimos (SM):

0,35 1,20 2,70 5,50 8,55
0,40 1,44 3,00 5,85 8,95
0,50 1,82 3,06 5,85 9,00
0,65 1,90 3,50 5,85 9,00
0,70 2,00 3,60 6,00 15,30
0,76 2,00 4,00 7,50 23,60
0,78 2,43 4,50 7,90 32,50
0,90 2,56 4,80 8,10 42,60
0,93 2,60 5,10 8,30 63,23
1
Prof. Renaldo A. GonsalvesPontifícia Universidade Católica de São Paulo
Para fazer esta primeira abordagem da construção dos intervalos de classe, o
pesquisador fez um estudo com as medidas de posição central e de dispersão.
Em Salários Mínimos
Média 7,37
Erro padrão 1,76
Mediana 3,60
Modo 5,85
Desvio padrão 11,80
Variância da amostra 139,31
Curtose 12,59
Assimetria 3,38
Intervalo 62,88
Mínimo 0,35
Máximo 63,23
Soma 331,76
Contagem 45,00
Para construir as duas classes, ele optou pela média (7,37 SM) como critério para
separar a população de “renda baixa” e da outra que apresenta “renda alta”. A partir
desta definição, contou o número de famílias (frequência) em cada um dos grupos.
Classes de Renda Frequência (f)

Até 7,37 SM 32 Renda baixa
Acima de 7,37 SM 13 Renda alta
Observando a tabela acima podemos fazer os seguintes questionamentos: a) as famílias

com renda de 7,37 SM mensais são pobres? b) as famílias com renda de 7,38 SM (0,01
SM acima da categoria anterior) são consideradas famílias ricas?
Evidentemente em uma pesquisa com dados tão extremos (a menor renda familiar é
0,35 SM e a maior, 63,23 SM), não pode ser representada por duas classes, esta é uma
abordagem incorreta. Os principais problemas desta abordagem são: ocultamos as
famílias de classe média e não apontamos as famílias que vivem em condição de
extrema pobreza.
Para definir o número de classes podemos afirmar que os intervalos devem ser uma
combinação entre a quantidade para descrever detalhes e a facilidade de leitura dos
dados. Esta combinação está ligada ao objetivo da pesquisa.
A sugestão é trabalhar com o número mínimo de dois (2) intervalos e no máximo quinze
(15). Adotar um número maior que 15 é possível, no entanto classes dificulta
significativamente a leitura dos resultados.
Portanto, não há uma regra objetiva para estabelecer o número de classes ao se fazer um
estudo. O número de classes está ligado às características do fenômeno analisado – por
exemplo, um estudo do perfil do consumidor na cidade de São Paulo necessita de um
número maior de classes, pois a distribuição da renda é muito desigual, e aos objetivos
da pesquisa.
2
Ao contrário da complexidade do estudo sobre os consumidores de São Paulo, os
intervalos de classes que definem o desempenho dos alunos de uma escola particular,
cujos alunos tenham características semelhantes podem ser pequenos. Neste caso,
bastaria apenas tratar como: baixo desempenho, desempenho intermediário, e alto
desempenho.
A sugestão do ponto de partida para a definição dos intervalos de classe pode ser a
análise do desvio padrão da amostra ou da população, que permite saber se a base de
dados que estamos tratando é homogênea (desvio padrão próximo de zero) ou
heterogênea (desvio padrão elevado). Outras medidas de dispersão como intervalo,
coeficiente de variação, poderão ser usadas também.
NOTA: Para que seja interessante a construção de intervalos de classe é necessário que
o conjunto de dados não seja igual para todos os elementos. Isto significaria dizer que,
se a renda dos moradores da cidade de São Paulo, apurada na pesquisa fosse igual para
todos não haveria necessidade de construir classes ou qualquer tipo de segmentação.
Portanto, se a base de dados é homogênea, necessitaremos de poucas classes, caso

contrário, usaremos mais intervalos. No caso dos consumidores da cidade de São Paulo,
podemos tratar com cinco intervalos: 1) abaixo da linha da pobreza (até 1 SM); 2) classe
“D” (acima de 1 até 3 SM); 3) classe “C” (acima de 3 até 6 SM); 4) classe “B” (acima
de 6 até 9 SM); 5) classe “A” (acima de 9 SM).
A recomendação, quanto ao tamanho dos intervalos, é que preferencialmente tenham o

mesmo tamanho. No entanto, usamos o primeiro intervalo com uma amplitude menor (1
SM), isto foi necessário, pois um dos objetivos da pesquisa é identificar o grupo de
consumidores que estão abaixo da linha da pobreza.
NOTA: Para construir uma distribuição de frequência devemos determinar os intervalos

de classe. É importante considerar que, se o número de classes é pequeno podemos
perder muita informação, pois a amplitude do intervalo será grande – quando separamos
em duas classes de renda a amostra dos consumidores da cidade de São Paulo isso
ocorreu.
Por outro lado se construímos um grande número de intervalos de classe, isso pode
tornar a distribuição de frequência extensa é a análise dos resultados poderá ficar
comprometida.
É apropriado, embora não necessário, que os intervalos tenham a mesma amplitude.
No outro extremo da tabela temos também uma amplitude de intervalo maior (54,23
SM). Isso ocorre devido a hipótese que as famílias com renda superior a 9 SM tenham
os mesmos hábitos de consumo.
Na tabela abaixo, apresentamos cinco classes de renda com intervalos diferentes. Na

linha da pobreza o intervalo é de 1 SM, depois muda para 3 SM (classes D; C e B), e na
classe “A” o intervalo cresce para 54,23 SM.
3
Classes de Renda Frequência (f) Conceito

Até 1 SM 9 Linha da Pobreza
Acima de 1 até 3 SM 10 Classe “D”
Acima de 3 até 6 SM 13 Classe “C”
Acima de 6 até 9 SM 8 Classe “B”
Acima de 9 SM 5 Classe “A”
Total 45 Observações
Na sub amostra de 45 elementos, observamos a frequência de 9 famílias na linha da

pobreza, 10 famílias na classe D, e assim sucessivamente. Estas contagens revelam a
frequência de famílias em cada intervalo.
Há outra notação possível para a tabela acima. Aproveitaremos o quadro abaixo para
introduzir o conceito de frequência relativa (F).
O símbolo barra com travessão (1 | 3 SM) significa acima de 1 SM até 3.
Classes de Renda Frequência absoluta (f) Frequência Relativa (F)

0| até 1 SM 9
1| até 3 SM 10
3| até 6 SM 13
6| até 9 SM 8
9| até 63,23 SM 5
Total 45
A frequência relativa é obtida pela divisão do número da frequência absoluta (p. ex. 9)
pelo total de observações (45) multiplicado por 100.
Temos então: ( 9/45) x 100 = 0,2 x100 = 20,00%

(10/45) x 100 = 0,2222 x100 = 22,22%
Classes de Renda Frequência absoluta (f) Frequência Relativa (F)

0| até 1 SM 9 20,00%
1| até 3 SM 10 22,22%
3| até 6 SM 13 28,89%
6| até 9 SM 8 17,78%
9| até 63,23 SM 5 11,11%
Total 45 100,00%
Os dados da tabela acima também podem ser vertidos em gráficos, estes são uma boa
alternativa para apresentar as informações de uma tabela. Como exemplo desta
transcrição, vamos usar os dados da distribuição de frequência absoluta, construímos
um histograma de barra.
4
Histograma de Barra frequência absoluta.
O gráfico acima mostra a mesma informação da tabela, no entanto, permite uma

interpretação mais fácil. Podemos inferir, observando o gráfico, que a classe mais
frequente é a que recebe renda acima de 3 SM até 6 SM.
Esta mesma informação na forma de um polígono de frequência.
Polígono de Frequência Absoluta
Para esta mesma informação, utilizando-se a escala de frequência relativa nós

construiremos um histograma de barras.
Frequência Relativa em %.
5
Nos gráficos apresentados acima, inferimos sempre a mesma informação, ou seja, que a
classe de renda de 3 SM e até 6 SM é a maior desta distribuição (têm maior frequência).
No entanto, o gráfico de frequência relativa permite inferir que 51,11% % das famílias
desta pesquisa frequentam o intervalo de 1 SM até 6 SM.
Neste estudo, o histograma de barra que foi usado para descrever a frequência relativa
da renda dos paulistanos, talvez seja o gráfico mais explicativo para o leitor.
Outros Gráficos.
A partir do exposto acima, podemos afirmar que existem dois processos de organização
dos dados de uma pesquisa: A) as tabelas de distribuição de frequências agrupadas; e B)
os gráficos.
Ambos os processos (tabelas e gráficos) tem como objetivo facilitar o entendimento das
informações de uma base de dados, pois, a partir desta compreensão, torna-se possível
inferir as características de uma realidade e tomar decisões.
Exemplos de Gráficos e Tabelas.
Uma pesquisa foi feita com uma amostra aleatória de 52 alunos, com objetivo de
verificar a quantia de dinheiro disponível no período da manhã em uma universidade da
cidade de São Paulo, revelou os seguintes valores:
Tabela de Frequência não agrupada em quantia de Dinheiro:
Neste estudo, obtemos a informação que a Média (ẋ) é maior

que a Mediana (Me), e esta é maior que a Moda (Mo) – ou seja, ẋ = R$ 15,20; Me = R$
13,00 e Mo = R$ 5,00. Isto significa que esperamos uma distribuição de frequência
positiva.
6
Dito de outra maneira, podemos afirmar que encontraremos, neste estudo, um número
maior de alunos com quantias menores de dinheiro. Para compreender como o poder
aquisitivo se distribui neste grupo de alunos, vamos estabelecer cinco classes de
disponibilidade de dinheiro (baixa; média baixa; média; média alta e alta) com
intervalos de R$ 10,00 para cada uma das classes.
7
Disponibilidade em R$ dos alunos – Tabela de Frequência Agrupada.

Intervalo de Classe Frequência Absoluta (f) Frequência Relativa (F)
0| 10 21 40,38%
10 | 20 13 25,00%
20 | 30 8 15,38%
30 | 40 6 11,54%
40 | 50 4 7,69%
Total 52 100,00%
Gráficos que representam a Tabela de Frequência Agrupada de disponibilidade de R$

dos alunos.
Histograma de Barra Frequência Absoluta.
Histograma de Barra Frequência Absoluta.
Polígono de Frequência Absoluta
8
Ogiva de Frequência Absoluta e Acumulada.
Outras representações:
 Tronco e Ramos.
Um estudo feito com uma amostra de 30 veículos, pela concessionária que administra a
estrada que liga São Paulo à Caminas (100 Km.), levantou o tempo de viagem destes
automóveis em minutos.
67 97 105 86 102 116

71 99 107 87 103 118
78 99 108 87 103 122
82 100 109 92 104 124
85 101 112 95 105 125
Com estes dados, o técnico que conduziu a pesquisa, resolveu organizar estas
informações em um gráfico chamado de Tronco e Ramos. Este recurso é usado para
distribuir a frequência dos dados.
As informações foram agrupadas em dezenas (a partir de 60) e centenas (a partir de

100). Assim, o automóvel que percorreu a estrada em 67 min. terá sua representação
gráfica 6 | 7; e o em 125 mi. 12 | 5.
Gráfico de Tronco e Ramos.
9
Usando este critério, chegou à conclusão que o tempo gasto para percorrer a estrada
com maior frequência está no intervalo de 100 até 109 minutos (10 automóveis), outra
observação importante é que 13 automóveis da amostra permaneceram na estrada um
tempo inferior a 100 minutos.
No outro extremo desta representação gráfica, encontrou 6 veículos com tempo acima
de 100 minutos.
 Diagrama de Pizza.
Os diagramas em forma de pizza são utilizados para mostrar participações.
Exemplo: Um pesquisador levantou dados secundários do orçamento anual do

Ministério da Educação (em bilhões de Reais) dividido em três categorias: (A) ensino
do terceiro grau em bilhões de Reais.
Despesas do MEC Bilhões de R$

Ensino de 3o Grau R$ 5,70
Total R$ 14,30
Para calcular as fatias que representam os gastos do MEC, devemos medir as

participações em ângulo. Assim, o ensino de 3º grau será [5,7/14,3 x(360o)] = 143,49o
ou 39,86% da Pizza.
No segundo grau [5,9/14,3 x (360o)] = 148,53º ou 41,26% da pizza, e para o 1º grau

teremos 67,97º ou 18,88%.
Podemos usar a seguinte fórmula:

 Participação 
Graus    x 360
 Todo 
Despesas do MEC em %
10
Observando o gráfico podemos afirmar que a prioridade do MEC, neste ano em que foi
feita a pesquisa, podemos afirmar que foi gasto a maior parte do orçamento com ensino
de 2º grau (41,26%), seguido pelo 3º com 39,86% e 1º grau com 18,88%.
Diagrama de Dispersão.
Os diagramas de dispersão são utilizados quando analisamos duas variáveis que

guardam entre si uma relação de causalidade, isto é, quando uma variável pode explicar
o comportamento da outra.
Um exemplo:
Um professor fez uma pesquisa relacionando o desempenho acadêmico (Nota Final) de

seus alunos e o número de aulas assistidas (Presença em Sala de Aula). A hipótese deste
professor é que alunos mais assíduos apresentam um rendimento escolar maior.
Para testar esta hipótese colecionou as notas finais e o número de aulas assistidas de
uma amostra aleatória de 25 alunos retirada de várias séries.
FALTAS 35 13 12 8 9 3 4 6 25 12 29 22 13 3 33 30 10 20 9 10 14 4 3 5 34
NOTA FINAL 2,0 8,0 7,5 9,0 9,5 10,0 8,0 8,0 4,0 6,0 4,5 4,5 5,0 9,5 2,5 4,0 5,0 5,0 6,5 5,5 4,5 8,5 6,5 8,5 1,5
Com os dados construiu um diagrama de dispersão:
DIAGRAMA DE DISPERSÃO
12,00
ESTUDO DA RELAÇÃO ENTRE A NOTA FINAL E AS FALTAS
10,00 3; 10,00
3; 9,50 9; 9,50
8; 9,00
4; 8,50
5; 8,50
8,00 6; 8,00
4; 8,00 13; 8,00
12; 7,50
9; 6,50
Nota Final
3; 6,50
6,00 12; 6,00
10; 5,50
10; 5,00 13; 5,00 20; 5,00
14; 4,50 22; 4,50 29; 4,50
4,00 25; 4,00 30; 4,00
33; 2,50
2,00 35; 2,00
34; 1,50
0,00
Faltas
0 5 10 15 20 25 30 35 40
Observando-se o gráfico acima, podemos afirmar que há uma relação de causa e efeito
entre as faltas e as notas finais, ou seja, quanto maior o número de faltas menor serão as
notas dos alunos e o inverso também é verdadeiro. Esta relação de causa e efeito é
conhecida como correlação, podendo ser medida numericamente. Estudaremos este
tema em um capítulo adiante.
11
Algumas sugestões de normas para as representações gráficas.
Os gráficos são apresentados em um sistema denominado sistema cartesiano ortogonal.

No eixo horizontal colocamos a variável independente (ou variável “x”), no caso acima
– as faltas dos alunos. E no eixo vertical, colocamos a variável dependente, ou seja, as
notas finais.
Geralmente as escalas se iniciam no zero – encontro do eixo vertical com o horizontal.
O gráfico deverá apresentar título, notas, números, legendas, fonte, e outras informações
necessárias para facilitar a sua leitura e evitar um texto com as explicações. O texto que
acompanha um gráfico deve apenas destacar a informação relevante.
O gráfico, sempre que possível, deverá ter um formato quadrado, evitando assim as
distorções no seu formato final.
As formas gráficas e as tabelas, bem como as medidas de dispersão e de posição central,

às vezes não são suficientes para avaliar e identificar adequadamente as distribuições de
frequência. Entre as formas assumidas pelas distribuições de frequência a distribuição
normal é uma das mais importantes.
A distribuição normal tem importantes propriedades que a transformam em uma

distribuição muito utilizada para a tomada de decisões, ou apenas para a compreensão
de uma realidade através de sua base numérica. Esta distribuição será estudada em outro
bloco junto com o tema probabilidade.
Uma das ferramentas utilizadas para identificação de uma distribuição de frequência

normal é o quartil. Além de permitir a identificação desta distribuição, usamos o
também o quartil para verificar as importantes características de uma base de dados.
Quartis.
Quartis são as medidas mais utilizadas para estudos de localização não central, e são
empregadas para descrever as propriedades de grandes bases de dados.
Definimos os quartis como sendo os valores que dividem a área do histograma (ou uma
base de dados) em quatro partes iguais, sendo medidas de posição dentro de uma base
de dados organizada do menor número observado para o maior. Desta maneira temos: o
1o Quartil (Q1): o 2o Quartil (Q2) – que é a mediana; o 3o Quartil (Q3).
Abaixo do primeiro quartil (Q1), ficam 25% de uma base de dados, os outros
75% ficam acima.
O segundo quartil (Q2), divide a base de dados em duas partes 50% ficam
abaixo e os outros 50% acima – esta medida é conhecida como mediana.
No terceiro quartil (Q3), 75% da base de dados ficam abaixo desta referência, os
outros 25% ficam acima.
12
Exemplo: Os dados abaixo foram levantados pelo gestor de uma escola que pesquisou o
número médio de alunos em 27 salas selecionadas aleatoriamente. Os dados obtidos
foram disponibilizados na tabela abaixo:
Número de alunos por sala.

28 55 37 46 17
43 44 42 39 35
48 48 27 20 45
51 33 47 45
43 45 42 38
30 37 23 19
Modo de calcular o Quartil – (passo a passo).
1. Ordene a base de dados do menor número para o maior.
17 19 20 23 27 28 30 33 35 37 37 38 39 42 42 43 43 44 45 45 45 46 47 48 48 51 55
2. O Q2 desta distribuição é a mediana. Neste caso temos n = 27, portanto a

base apresenta um número impar de observações.
Quando isso ocorre aplicamos a seguinte fórmula para encontrar a mediana
ou o segundo quartil, o Q2:
Então:
17 19 20 23 27 28 30 33 35 37 37 38 39 42 42 43 43 44 45 45 45 46 47 48 48 51 55
A 14º posição é o número 42. Este é o Quartil 2 (Q2) da nossa base de dados.
Temos 50% dos dados à esquerda e 50% dos dados à direita de 42.
3. Para encontrar Q1, temos que dividir os 50% dos dados abaixo de 42 em
duas partes iguais, para isso, basta observar que neste caso n = 13, aplicando-
se o mesmo princípio da fórmula acima, teremos (13 + 1) / 2 = 7.
Se contarmos à esquerda do úmero 42 sete posições, o número encontrado
será o Q1.
17 19 20 23 27 28 30 33 35 37 37 38 39 42 42 43 43 44 45 45 45 46 47 48 48 51 55
O número encontrado é o 30, este é o Q1, e abaixo dele temos 25% da nossa
base de dados.
4. O Q3 nós encontraremos da mesma maneira, mas examinando a base de

dados acima de 42. Desta maneira encontramos o número 45 (Q3).
13
Q1 Q2 Q3
17 19 20 23 27 28 30 33 35 37 37 38 39 42 42 43 43 44 45 45 45 46 47 48 48 51 55
Os Quartis Q1, Q2 e Q3 geram um gráfico chamado “caixa com bigodes” (Box Plot)
que facilita a interpretação destas medidas de posição.
Um gráfico de caixa com bigodes usa cinco valores-chave para descrever um conjunto
de dados: Q1, Q2 e Q3, o valor mínimo e o valor máximo.
Q1 30
Q2 = a mediana 42
Q3 45
Valor mínimo 17
Valor máximo 55
Salas de Aula
Q1=30
Q2 =42
Q3 =45
Mínimo Máximo = 55
Amplitude interquartílica 45 – 30 =15
A distância interquartílica de Q2 e Q1 é maior, portanto nesta base de dados

observamos um número maior de salas com poucos alunos. Este é um indicador de
assimetria, isto significa que estamos tratando de uma distribuição assimétrica negativa.
Em um estudo de estatura, feita com uma amostra de 52 alunos de uma universidade

católica, apontou que a média a mediana e a moda são iguais a 1,72 cm. Para
compreender a distribuição fez-se um diagrama do tipo caixa com bigodes.
Estatura dos alunos.
14
Como podemos afirmar que esta distribuição é simétrica. Há equilíbrio na distribuições

dos quartis.
Neste mesmo estudo, solicitou-se aos alunos que declarassem a quantia em Reais (R$),
que dispunham no momento. O diagrama de caixa com bigodes deste estudo apresentou
a seguinte distribuição.
Dinheiro
Temos agora uma distribuição assimétrica à direita, os dois asteriscos (* *) que

observamos no diagrama, revelam que existem dois valores discrepante (pontos fora da
curva) na base de dados. Neste caso é possível afirmar que os dados estão concentrados
entre Q1 e Q2.
Caso a base de dados, que estamos analisando, tenha um número “n” par de
observações, usamos o seguinte recurso para encontrar Q2 e as outras posições.
Quando somamos 2 à nossa base de dados, na prática estamos escolhendo o primeiro

número acima do ponto central.
15
Exemplo: Temos uma amostra com oito observações.
33,50 34,00 34,00 39,00 41,00 42,50 43,00 43,50
O ponto que divide a série em duas partes iguais (mediana) é o intervalo entre 39 e 41.
Quando aplicamos a fórmula, a mediana fica sendo o número 41 ou a quinta posição da
nossa amostra, por este mesmo critério, as outras posições Q1 e Q3 estarão deslocadas
para a direita.
Percentis e Decis.
No próximo bloco trataremos do tema, estatística probabilística.
16

Introdução À Estatística Descritiva AP3a

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Introdução À Estatística Descritiva AP3a

Transféré par

Droits d'auteur :

Formats disponibles

Prof. Renaldo A.

GonsalvesPontifícia Universidade Católica de São Paulo

Distribuições de Frequências ou Intervalo de classes.

As distribuições de frequências são utilizadas quando desejamos resumir grandes

A descoberta de padrões, ou de características das populações (ou amostras), a partir da

Outro uso para as distribuições de frequência organizadas por intervalos de classe é a

Suponha que um instituto de pesquisa aplicou 16.000 questionários na cidade de São

A organização destes dados distribuídos por frequência em intervalos de classe é a

A subjetividade para estabelecer o número de classes:

Suponha que o pesquisador do instituto de pesquisa, ao examinar a base de dados, tenha

Renda em salários mínimos (SM):

Classes de Renda Frequência (f)

Observando a tabela acima podemos fazer os seguintes questionamentos: a) as famílias

Portanto, se a base de dados é homogênea, necessitaremos de poucas classes, caso

A recomendação, quanto ao tamanho dos intervalos, é que preferencialmente tenham o

NOTA: Para construir uma distribuição de frequência devemos determinar os intervalos

É apropriado, embora não necessário, que os intervalos tenham a mesma amplitude.

Na tabela abaixo, apresentamos cinco classes de renda com intervalos diferentes. Na

Classes de Renda Frequência (f) Conceito

Na sub amostra de 45 elementos, observamos a frequência de 9 famílias na linha da

O símbolo barra com travessão (1 | 3 SM) significa acima de 1 SM até 3.

Classes de Renda Frequência absoluta (f) Frequência Relativa (F)

Temos então: ( 9/45) x 100 = 0,2 x100 = 20,00%

Classes de Renda Frequência absoluta (f) Frequência Relativa (F)

Histograma de Barra frequência absoluta.

O gráfico acima mostra a mesma informação da tabela, no entanto, permite uma

Esta mesma informação na forma de um polígono de frequência.

Polígono de Frequência Absoluta

Para esta mesma informação, utilizando-se a escala de frequência relativa nós

Exemplos de Gráficos e Tabelas.

Tabela de Frequência não agrupada em quantia de Dinheiro:

Neste estudo, obtemos a informação que a Média (ẋ) é maior

Disponibilidade em R$ dos alunos – Tabela de Frequência Agrupada.

Gráficos que representam a Tabela de Frequência Agrupada de disponibilidade de R$

Histograma de Barra Frequência Absoluta.

Histograma de Barra Frequência Absoluta.

Polígono de Frequência Absoluta

Ogiva de Frequência Absoluta e Acumulada.

67 97 105 86 102 116

As informações foram agrupadas em dezenas (a partir de 60) e centenas (a partir de

Gráfico de Tronco e Ramos.

Os diagramas em forma de pizza são utilizados para mostrar participações.

Exemplo: Um pesquisador levantou dados secundários do orçamento anual do

Despesas do MEC Bilhões de R$

Para calcular as fatias que representam os gastos do MEC, devemos medir as

No segundo grau [5,9/14,3 x (360o)] = 148,53º ou 41,26% da pizza, e para o 1º grau

Podemos usar a seguinte fórmula:

Os diagramas de dispersão são utilizados quando analisamos duas variáveis que

Um professor fez uma pesquisa relacionando o desempenho acadêmico (Nota Final) de

Com os dados construiu um diagrama de dispersão:

Os gráficos são apresentados em um sistema denominado sistema cartesiano ortogonal.

Geralmente as escalas se iniciam no zero – encontro do eixo vertical com o horizontal.

As formas gráficas e as tabelas, bem como as medidas de dispersão e de posição central,

A distribuição normal tem importantes propriedades que a transformam em uma

Uma das ferramentas utilizadas para identificação de uma distribuição de frequência

Número de alunos por sala.

Modo de calcular o Quartil – (passo a passo).

1. Ordene a base de dados do menor número para o maior.

2. O Q2 desta distribuição é a mediana. Neste caso temos n = 27, portanto a

4. O Q3 nós encontraremos da mesma maneira, mas examinando a base de

Amplitude interquartílica 45 – 30 =15

A distância interquartílica de Q2 e Q1 é maior, portanto nesta base de dados

Em um estudo de estatura, feita com uma amostra de 52 alunos de uma universidade