Vous êtes sur la page 1sur 76

Estatística Descritiva

Wanderley de Oliveira Pereira


2017.1
O que é a estatística ?

Para muitos, a estatística não passa de


conjuntos de tabelas de dados
numéricos. Os estatísticos são pessoas
que coletam esses dados.
Associar estatística a censo é
perfeitamente correto do ponto de vista
histórico.

Estatística e Estado têm a mesma origem


latina: status.
Definição de Estatística

A estatística é um conjunto de técnicas que


permite, de forma sistemática, organizar,
descrever, analisar e interpretar dados
(numéricos ou não) oriundos de estudos
ou experimentos, realizados em qualquer
área do conhecimento.
Estatística /Estatísticas
• Estatística: indica uma metodologia
desenvolvida para a coleta, a classificação, a
apresentação, a análise e a interpretação de
dados quantitativos e a utilização desses dados
para a tomada de decisões.

• Estatísticas: indica qualquer coleção de dados


numéricos, reunidos com a finalidade de
fornecer informações acerca de uma atividade
qualquer.
Importância
A Estatística trabalha com informações,
associando os dados a algum problema,
descobrindo como e o que coletar, assim
capacitando o pesquisador (ou profissional ou
cientista) a obter conclusões a partir dessas
informações, de tal forma que possam ser
entendidas por outras pessoas.
Áreas da Estatística
• Estatística Descritiva: Conjunto de técnicas que
objetivam coletar, organizar, apresentar, analisar
e sintetizar os dados numéricos de uma
população, ou amostra;
• Estatística Inferencial: Processo de se obter
informações sobre uma população a partir de
resultados observados na amostra;
• Probabilidade: Modelos matemáticos que
explicam os fenômenos estudados pela Estatística
em condições normais de experimentação.
Exemplos
• Anuário Estatístico Brasileiro
O IBGE publica esse anuário apresentando, em
várias tabelas, os mais diversos dados sobre o
Brasil: educação, saúde, transporte, economia,
cultura, etc. Embora simples, fáceis de serem
entendidas, as tabelas são o produto de um
processo demorado e extremamente
dispendioso de coleta e apuração de dados.
Exemplos
• Análise financeira.
Os analistas financeiros estudam dados sobre a
situação da economia, visando explicar
tendências dos níveis de produção e de
consumo, projetando-os para o futuro.
Probabilidade
• O processo de generalização, que é característico
do método indutivo, está associado a uma
margem de incerteza. A existência da incerteza
deve-se ao fato de que a conclusão, que se
pretende obter para o conjunto de todos os
indivíduos analisados quanto a determinadas
características comuns, baseia-se em uma parcela
do total das observações. A medida da incerteza
é tratada mediante técnicas e métodos que se
fundamentam na Teoria da Probabilidade. Essa
teoria procura quantificar a incerteza existente
em determinada situação.
Fases do Método Estatístico
• Definição do problema
• Planejamento
• Coleta de dados
• Apuração dos dados
• Apresentação dos dados
• Análise e Interpretação dos dados
Definição do problema
Consiste na:
• formulação correta do problema;
• examinar outros levantamentos realizados no
mesmo campo (revisão da literatura);
• saber exatamente o que se pretende
pesquisar é definir o problema corretamente
(variáveis, população, hipóteses, etc.)
Planejamento
Determinar o procedimento necessário para
resolver o problema:
• Como levantar informações;
• Tipos de levantamentos:
- Por Censo (completo);
- Por Amostragem (parcial).
• Cronograma, Custos, etc.
Coleta dos dados
Consiste na obtenção dos dados referentes ao
trabalho que desejamos fazer.
• A coleta pode ser:
Direta - diretamente da fonte – contínua,
periódica e ocasional;
Indireta - feita através de outras fontes – feitas
por analogia, proporcionalização, indícios e
avaliação.
Apuração dos dados
Consiste em resumir os dados, através de uma
contagem e agrupamento. É um trabalho de
coordenação e de tabulação.
• Apuração: manual, mecânica, eletrônica e
eletromecânica.
Apresentação dos dados
É a fase em que vamos expor os resultados
obtidos na coleta e na organização.
• Esta apresentação pode ser:
Tabular (apresentação numérica)
Gráfica (apresentação geométrica)
Análise e Interpretação dos dados
É a fase mais importante e também a mais
delicada.

O pesquisador tira conclusões que o


auxiliam a resolver seu problema.
Conceitos Fundamentais e Definições
• População: conjunto de elementos que tem pelo
menos uma característica em comum.
• Amostra: subconjunto de elementos de uma
população. Este subconjunto deve ter dimensão
menor que o da população e seus elementos devem
ser representativos da população.
• Finitos: possuem um número limitado de
elementos.
• Infinitos: possuem um número ilimitado de
elementos.
• Amostragem Aleatória: Cada elemento da
população tem a mesma chance de ser
escolhido.
• Amostragem Estratificada: Classificar a
população em, ao menos dois estratos e
extrair uma amostra de cada um.
• Amostragem Sistemática: Escolher cada
elemento de ordem k.
• Amostragem por Conglomerados: Dividir em
seções a área populacional, selecionar
aleatoriamente algumas dessas seções e
tomar todos os elementos das mesmas.
• Amostragem de Conveniência: Utilizar
resultados de fácil acesso.
• Variável: é a característica que vai ser
observada, medida ou contada nos elementos
da população ou da amostra e que pode
variar, ou seja, assumir um valor diferente de
elemento para elemento.
• Variável qualitativa: é uma variável que assume
como possíveis valores: atributos ou qualidades.
Também são denominadas variáveis categóricas.
• Variável qualitativa nominal: atributos ou
qualidades que não apresentam uma ordem
natural de ocorrência.
• Variável qualitativa ordinal: atributos ou
qualidades que apresentam uma ordem natural
de ocorrência.
Exemplos
• Exemplo 01: meios de informação utilizados
pelos alunos da disciplina Estatística Descritiva
do curso de Matemática da FAFIDAM:
televisão, revista, internet, jornal.
• Exemplo 02: estado civil dos alunos da
disciplina Estatística Descritiva do curso
Matemática da FAFIDAM: solteiro, casado,
separado.
• Variável quantitativa: é uma variável que
assume como possíveis valores, números.
• Variável quantitativa discreta: representadas
geralmente por números inteiros, formando um
conjunto finito ou enumerável.
• Variável quantitativa contínua: representadas
por números, em intervalos da reta real e, em
geral, resultantes de mensurações.
Exemplos
• Exemplo 03: Idade dos alunos da disciplina
Estatística Descritiva do curso de Matemática
da FAFIDAM: 18, 18, 19, 17, 21, 25, 30,...
• Exemplo 04: peso (quilogramas) dos alunos da
disciplina Estatística Descritiva do curso de
Matemática da FAFIDAM: 46,5; 48,85; 49;
51,30; 55,12; 62,0 ...
Representação tabular
Série Estatística
Uma série estatística é um conjunto de dados
ordenados segundo uma característica comum,
as quais servirão posteriormente para se fazer
análises e inferências.
Série Homógrada: a variável descrita tem
variação discreta.
Série Heterógrada: o fenômeno ou fato é
apresentado em graduações ou subdivisões.
Série Temporal ou Cronológica: É a série cujos
dados estão dispostos em correspondência com
o tempo, ou seja, varia o tempo e permanece
constante o fato e o local.
Série Geográfica ou Territorial: É a série cujos
dados estão dispostos em correspondência com
o local, ou seja, varia o local e permanece
constante a época e o fato.
Série Específica ou Qualitativa: É a série cujos
dados estão dispostos em correspondência com
a espécie ou qualidade, ou seja, varia o fato e
permanece constante a época e o local.
Série Mista ou Composta: A combinação entre duas ou
mais séries constituem novas séries denominadas
compostas e apresentadas em tabelas de dupla
entrada. O nome da série mista surge de acordo com a
combinação de pelo menos dois elementos.
Distribuição de Frequências
É o tipo de série estatística na qual permanece
constante o fato, o local e a época. Os dados são
colocados em classes preestabelecidas,
registrando a frequência de ocorrência.
Algumas definições
• Dados Brutos: dados originais que ainda não
se encontram prontos para análise.
• Rol: são os dados brutos organizados em
ordem crescente ou decrescente.
Distribuição de Frequência Discreta ou Pontual:
Os valores das variáveis aparecem
individualmente.

Distribuição de Frequências Intervalar: os


valores da variável não aparecem
individualmente, mas agrupados em classes.
Distribuição de Frequência Discreta
Distribuição de Frequências Intervalar
Elementos de uma distribuição de
frequências.
• Amplitude total (A): é a diferença entre o
maior e o menor número do rol.
Elementos de uma distribuição de
frequências.
• Amplitude total (A): é a diferença entre o
maior e o menor número do rol.
• Número de classes (K).
A Regra de Sturges, que nos dá o número de classes em
função do número de valores da variável.
Para uma série com n elementos (valores):
K=1+3,3.logn
ou
K=5, se n for menor ou igual a 25
K ≈ 𝑥 = 𝑛, se n for maior que 25
• Amplitude de um intervalo de classe (h): é o
comprimento que define a classe.
h=A/K.
• Amplitude de um intervalo de classe (h): é o
comprimento que define a classe.
h=A/K.
• Limites de Classe (i): os extremos de cada
classe
li = limite inferior (linf) e
Li = limite superior (Lsup)
Observação: Vamos trabalhar com intervalos
fechados à esquerda e abertos à direita; isso
significa que valores iguais ou superiores ao
limite inferior são considerados nessa classe e
valores iguais e/ou superiores ao limite superior
são considerados na classe abaixo.
• Ponto Médio da Classe - (xi): o ponto que
divide o intervalo de classe em duas partes
iguais.
𝑙𝑖 + 𝐿𝑖
𝑥𝑖 =
2
• Frequências
• Frequências simples ou absoluta da classe i (fi):
são os valores que realmente representam o
número de dados de cada classe.
• A soma das frequências simples é igual ao
número total dos dados.
• Frequências relativas (fri) – são os valores das
razões entre as frequências simples e o
número total de dados.
𝑓𝑖
fr𝑖 =
𝑛
• Frequência acumulada (Fi) – é o total das
frequências de todos os valores inferiores ao
limite superior do intervalo de uma dada
classe.
• Frequência acumulada relativa (Fri) – é a
frequência acumulada da classe, dividida pela
frequência total da distribuição.
𝐹𝑖
Fr𝑖 =
𝑛
Conceitos básicos
Proporção
x
Porcentagem
x
Razão
x
Taxa
Arredondamentos
• 1°. Se o primeiro algarismo após aquele que
formos arredondar for de 0 a 4, conservamos
o algarismo a ser arredondado e desprezamos
os seguintes.
• 2°. Se o primeiro algarismo após aquele que
formos arredondar for de 6 a 9, acrescenta-se
uma unidade no algarismo a ser arredondado
e desprezamos os seguintes.
• 3°. Se o primeiro algarismo após aquele que
formos arredondar for 5, seguido apenas de
zeros, conservamos o algarismo se ele for par
ou aumentamos uma unidade se ele for
ímpar, desprezando os seguintes.
• 4°. Se o 5 for seguido de outros algarismos dos
quais, pelo menos um é diferente de zero,
aumentamos uma unidade no algarismo e
desprezamos os seguintes.
• 5°. Quando, arredondarmos uma série de
parcelas, e a soma ficar alterada, devemos
fazer um novo arredondamento (por falta ou
por excesso), na maior parcela do conjunto, de
modo que a soma fique inalterada.
Exemplo 01
• Construa a Tabela de Frequência sobre os dados
abaixo:
Alturas (em cm) de 50 estudantes da Universidade ABC
140 141 141 143 143 143 145 146 1470 149

149 149 150 150 151 152 152 153 153 154

155 155 156 157 157 159 159 160 160 160

160 162 163 164 164 165 167 168 168 168

169 171 171 172 172 174 176 178 182 192
Exemplo 02
20 observações relativas ao índice pluviométrico
em determinados municípios do Estado
MILÍMETROS DE CHUVA

144 152 159 160

160 151 157 146

154 145 141 150

142 146 142 141

141 150 143 158


GRÁFICOS
• Histograma: é formado por um conjunto de
retângulos justapostos, cujas bases se
localizam sobre o eixo horizontal, de tal modo
que seus pontos médios coincidem com os
pontos médios dos intervalos de classe.
HISTOGRAMA
• As larguras dos retângulos são iguais às
amplitudes dos intervalos de classe.
• As alturas dos retângulos devem ser
proporcionais às frequências das classes,
sendo igual a amplitude dos intervalos.
• Polígono de frequência: é um gráfico em
linha, sendo as frequências marcadas sobre
perpendiculares ao eixo horizontal, levantada
pelos pontos médios dos intervalos de classe.
• Polígono de frequência acumulada: é traçado
marcando-se as frequências acumuladas sobre
perpendiculares ao eixo horizontal, levantadas
nos pontos correspondentes aos limites
superiores dos intervalos de classe.
• Distribuição de frequência sem intervalos de
classe: é representada graficamente por um
diagrama em que cada valor da variável é
representado por um segmento de reta
vertical e de comprimento proporcional à
respectiva frequência.
Exemplo 01
Construir um Histograma, um polígono de frequências
e um polígono de frequências acumuladas para
representar os dados abaixo.
Alturas (em cm) de 50 estudantes da Universidade ABC
140 141 141 143 143 143 145 146 1470 149

149 149 150 150 151 152 152 153 153 154

155 155 156 157 157 159 159 160 160 160

160 162 163 164 164 165 167 168 168 168

169 171 171 172 172 174 176 178 182 192
Gráficos de Linhas
• Geralmente utilizado para ilustrar uma Série
Temporal.
• Num plano de 2 dimensões, marcamos um
ponto no par ordenado correspondente a
variável e ao valor observado.
• Em seguida, unimos cada ponto ao seu
sucessor por um segmento de reta.
Gráfico de Linhas
• Geralmente utilizado para ilustrar uma Série
Mista, em que uma série é a Série Temporal.
Gráficos de colunas ou barras
• Usado para ilustrar qualquer tipo de série
(variáveis nominais e ordinais).
Gráficos de colunas ou barras
• Características:
• Os retângulos devem ter a mesma largura;
• O comprimento do retângulo é proporcional a
frequência (escolher uma escala);
• A distância entre os retângulos deve ser de
2/3 da largura do retângulo.
• O número de retângulos não deve ser maior
que 12.
Gráfico de colunas comparativas
(Justapostas)
• Ilustrar uma Série Mista
Gráfico de colunas comparativas
(Sobrepostas)
Gráfico de Barras
• Séries com variáveis com designações
extensas. Características iguais ao de Colunas.
Gráfico de
Barras
comparativo

Vous aimerez peut-être aussi