Vous êtes sur la page 1sur 67

http://goo.

gl/Pycd5U

Prof. Eliseu Castelo Branco Jr


ecastelob@gmail.com
1. Introdução à Estatística
2. Apresentação dos dados
3. Distribuição de Frequência
4. Medidas de Posição
5. Medidas de Tendência Central
6. Aplicação a Estatística Descritiva
7. Medidas de Dispersão
8. Medidas de Assimetria e Curtose
9. Probabilidade
10. Probabilidade da soma
11. Probabilidade condicional
12. Teorema da Probabilidade Total e Bayes
13. Probabilidade Binomial
14. Aplicação da probabilidade Binomial
 O aluno deverá ser capaz de:
 Identificar e construir o significado da
Estatística
 Perceber a importância da Estatística como
ferramenta de análise de dados , tomada de
 decisão e a utilização em pesquisa.
 Saber diferenciar população e amostra
 Saber reconhecer, selecionar e aplicar os
tipos de variáveis utilizadas em um trabalho
estatístico.
 1.1 - Origem
 1.2 - Definição de População e Amostra
 1.3 - Variáveis
 1.3.1 Conceito
 1.3.2 Tipos de variáveis
 1.3.4 Variação em relação aos fenômenos
 1.3.5 Princípios para classificação das
variáveis
 A origem da palavra Estatística está associada à
palavra latina STATUS (Estado).
 Há indícios de que 3000 anos A.C. já se faziam
censos na Babilônia, China e Egito e até mesmo o
4o. livro do Velho Testamento faz referência à
uma instrução dada a Moisés, para que fizesse
um levantamento dos homens de Israel que
estivessem aptos para guerrear.
 Usualmente, estas informações eram utilizadas
para a taxação de impostos ou para o
alistamento militar.
 O Imperador César Augusto, por exemplo,
ordenou que se fizesse o Censo de todo o
Império Romano.
 Contudo, mesmo que a prática de coletar
dados sobre colheitas, composição da
população humana ou de animais, impostos,
etc., fosse conhecida pelos egípcios, hebreus,
caldeus e gregos, e se atribuam a Aristóteles
cento e oitenta descrições de Estados, apenas
no século XVII a Estatística passou a ser
considerada disciplina autônoma, tendo
como objetivo básico a descrição dos BENS
do Estado.
 O termo estatística deriva
do neolatim statisticum collegium ("conselho
de Estado") e do Italiano statista ("estadista"
ou "político").
 O alemão Statistik, introduzido pela primeira
vez por Gottfried Achenwall (1749),
designava originalmente a análise de
dados sobre o Estado, significando a "ciência
do Estado”
 John Graunt (1620-1674) e William Petty
(1623-1687) foram os primeiros a se
preocuparam com o estudo numérico dos
fenômenos sociais e políticos, na busca de
leis quantitativas que pudessem explicá-los.
 O estudo consistia essencialmente de
exaustivas análises de nascimentos e mortes,
realizadas através das Tábuas de Mortalidade,
que deram origem às atuais Tábuas de
Mortalidade usadas pelas companhias de
seguros. Um dos resultados mais importantes
foi a constatação de que o percentual de
nascimento de crianças do sexo masculino
(51%) é levemente superior ao do sexo
feminino (49%).
 Francis Galton (1822-1911):
 Pesquisou a distribuição geográfica da beleza, a
moda, as impressões digitais, a eficácia da oração
religiosa e o levantamento de peso. Também criou
o conceito estatístico de correlação, a amplamente
promovida regressão em direção à média e várias
invenções como um periscópio, um dispositivo
para abrir cadeados e uma versão inicial da
impressora de teletipo. Ele foi o primeiro a aplicar
métodos estatísticos para o estudo das diferenças
e herança humanas de inteligência.
 Entre 1893 e 1912 escreveu um
conjunto de 18 artigos
denominado Mathematical
Contribution to the Theory
Evolution, com contribuições
extremamente importantes para
o desenvolvimento da teoria da
Análise de Regressão e do
Coeficiente de Correlação, bem
Karl Pearson (1857-1936) como do teste de hipóteses de
qui-quadrado.
 William Sealey Gosset (1876-1937)
estudou Química e Matemática na
New College Oxford. Em 1899 foi
contratado como Químico da
Cervejaria Guiness em Dublin,
desenvolvendo um trabalho
extremamente importante na área
de Estatística. Devido à necessidade
de manipular dados provenientes de
pequenas amostras, extraídas para
melhorar a qualidade da cerveja,
Gosset derivou o teste t de Student
baseado na distribuição de
probabilidades.
 A contribuição de Ronald Aylmer
Fisher (1890-1962) para a
Estatística Moderna é, sem
dúvidas, a mais importante e
decisiva de todas. Formado em
astronomia pela Universidade de
Cambridge em 1912, foi o
fundador do célebre Statistical
Laboratory da prestigiosa Estação
Agronômica de Rothamsted,
contribuindo enormemente tanto
para o desenvolvimento da
Estatística quanto da Genética.
 Albert Einstein (1879-1955)
 Entre os artigos revolucionários de
Einstein de 1905, estava um sobre
o movimento browniano, que tinha
como objetivo explicar as
flutuações estatísticas e descobrir
fatos que demonstrassem a
existências de átomos com
dimensões finitas e determinadas.
 Ele queria determinar o número de
Avogadro e o tamanho dos
átomos.
1 mol de moléculas de um gás possui
aproximadamente 6,022 × 1023 moléculas
deste gás (Número de Avogadro)
 O dicionarista Aurélio Buarque de Holanda
Ferreira definiu-a como uma parte da
matemática em que se investigam os
processos de obtenção, organização e análise
de dados sobre uma população ou sobre
seres quaisquer, e os métodos de tirar
conclusões e fazer predições com base
nesses dados.”
 Os dados se referem a fenômenos de massa,
ou coletivos, e às relações entre eles.
 Métodos estatísticos são métodos para o
tratamento de dados numéricos e referem-se
a dados coletados, cujo destino é permitir
que os estatísticos cheguem a conclusões
sobre o que está sendo estudado (pessoas ou
coisas
 A estatística tem por objetivo o estudo de
fenômenos de massa, ou coletivos, e das relações
entre eles.

 A estatística procura encontrar leis de


comportamento para toda a população, ou
universo; não se preocupa, portanto com
cada elemento em particular.

 De acordo com o seu tamanho, a população, ou


universo, pode ser classificada como finita ou
infinita.
 População Finita: o número total (número
finito) de elementos é conhecido.
 Exemplo: análise das notas de 30 alunos de
uma turma de estatística.
 População Infinita: população que possui um
número infinito ou incontável de elementos.
 Exemplo: quantidade de grãos de areia da
praia de Jericoacoara.
 Quando a população é muito grande, certamente
é difícil, ou mesmo impossível, a observação de
determinada característica em todos os seus
elementos.
 Daí a necessidade de selecionarmos uma parte
finita dessa população, para que possamos
realizar a observação e obter os dados que
desejamos.
 A esta parte da população denominamos
AMOSTRA ou ESPAÇO AMOSTRAL.
 Amostra é um subconjunto de elementos
retirados da população que usamos para obter os
dados
 A Pluri consultoria em conjunto com a Stochos Sports &
Entertainment divulgaram essa semana o que seria primeira
pesquisa de torcidas de 2013. Esse estudo compreende os
meses de aferição de novembro de 2012 a fevereiro de
2013. Foram entrevistados 21.049 pessoas acima de 16 anos
em 146 municípios espalhados pelo país.
O levantamento confirmou o Flamengo (16.8) como maior
torcida do Brasil, seguido de perto pelo Corinthians
(14.6%). Um pouco fora da disputa das maiores, segue o
tricolor paulista com 8.1%. A surpresa fica por conta do
Vasco (5%) ter ultrapassado a torcida do Palmeiras (4.9%)
em menos de um ano.

 Fonte: http://top10mais.org/top-10-maiores-torcidas-do-
brasil/#ixzz3SmBa03pq
 Estatística Descritiva ou Dedutiva: Tem como
objetivo descrever e analisar determinada
população ou amostra, sem pretender tirar
conclusões genéricas
 Trabalha resumindo os números para que
possam ser mais facilmente interpretados
 Estatística Indutiva ou Inferência Estatística:
baseado nos resultados obtidos pela análise
da amostra, procura inferir, deduzir leis de
comportamento da população total.
 Faz uma generalização a partir de resultados
particulares
 Dados Nacionais: Instituto Brasileiro de
Geografia e Estatística (IBGE)
www.ibge.com.br
 Dados Educacionais: Instituto Nacional de
Estudos e Pesquisas Anísio Teixeira (INEP) –
www.inep.gov.br
 Dados Sociais e Trabalhistas – Organização
Internacional do Trabalho (OIT) – www.ilo.org
1. definição do problema
2. delimitação do problema
3. planejamento para obtenção dos dados
4. coleta dos dados
5. apuração dos dados
6. apresentação dos dados
7. análise dos dados
8. interpretarão dos dados
 Consiste em definir com clareza o que
pretendemos pesquisar, qual é o objeto
de estudo e qual é exatamente o objetivo que
desejamos alcançar.
 Além de considerar detidamente o problema
objeto do estudo, o analista deverá examinar
outros levantamentos realizados no mesmo
campo e que sejam análogos, uma vez que
parte da informação de que se necessita pode
ser encontrada nestes últimos.
 Não é suficiente saber com clareza o que
pretendemos pesquisar.
 É também necessário saber
 onde será realizada a pesquisa:
 em que local,
 com que tipo de pessoas (ou coisas),
 em que período: semanas, dias (ou horários)
 Como vamos fazer para resolver o problema?
 Que dados serão necessários?
 Como obter esses dados?
 Qual será o método de investigação? pura
observação, questionário ou entrevista?
 Quem irá distribuir questionários ou realizar
as entrevistas?
 Qual o tamanho da população e da amostra?
 Quanto pretendemos gastar com a pesquisa?
 Nesta fase os dados são obtidos mediante o
processo de investigação.
 É a fase mais importante da pesquisa
 Antes de iniciarmos a apuração dos dados
obtidos na pesquisa, devemos proceder à crítica
dos mesmos, ou seja, descartar aqueles dados
que foram fornecidos de forma errônea.
 Por exemplo, questionários respondidos pela
metade não deverão ser levados em
consideração.
 Nessa etapa resumimos os dados por meio de
contagem, separação por tipo de resposta e de
agrupamento de dados semelhantes:
TABULAÇÃO DE DADOS.
Tabelas: têm a vantagem de conseguir expor,
sinteticamente e em só local, os resultados sobre
determinado assunto, de modo a se obter uma visão
global mais rápida daquilo que se pretende analisar.

Gráfico: É uma apresentação geométrica dos dados


numéricos que permite ao analista obter uma visão
rápida, fácil e clara do fenômeno e sua variação.
 A Apresentação deve ocorrer em forma de
tabelas ou gráficos
 Nessa fase, o interesse principal do
estatístico (ou pesquisador) é tirar conclusões
que o auxiliem na solução do problema que o
levou a executar a pesquisa.
 Tal análise está intimamente ligada ao cálculo
de medidas que permite descrever, com
detalhes, o fenômeno que está sendo
analisado.
 Para a interpretação dos dados analisados,
devemos ter, em mãos os tabulados, os gráficos
(se tiverem sido feitos) e os cálculos das medidas
estatísticas, que nos permitem até mesmo
arriscar algumas generalizações
 Lembramos que tais generalizações (a inferência
estatística) são acompanhadas de um certo grau
de incerteza, pois não podemos garantir 100%
que os resultados obtidos numa amostra sejam
totalmente verdadeiros para toda a população da
qual aquela amostra pertence
 Livro Estatística Aplicada a Todos os Níveis
 Páginas 21 e 22
 Exercício:
 Utilize as fases 1 e 2 do método estatístico e crie
um objetivo de pesquisa estatística e delimite-o
no tempo e no espaço.
 Ex: Objetivo: Pesquisa sobre gênero de filme
preferido dos cinéfilos de Fortaleza no Shopping
Iguatemi.
 Período da Pesquisa: finais de semana do mês de
Março/2015 no horário de 14:00 as 20:00hs.
Local da Pesquisa: entrada do Cinema
 Público pesquisado: homens entre 16 e 40 anos
 1.3 - Variáveis
 1.3.1 Conceito
 1.3.2 Tipos de variáveis
 1.3.4 Variação em relação aos fenômenos
 1.3.5 Princípios para classificação das
variáveis
 As pessoas de uma comunidade podem ser
analisadas de diversos ângulos:
 Ex: Sexo; Estatura, Renda, Escolaridade, etc
 Variáveis são propriedades associadas com
conceitos ou números e expressam
informação sobre a forma de medida
 Variável é qualquer característica associada a
uma população.
 Qualitativa nominal: os valores representam
atributos ou qualidades mas não tem uma
relação de ordem entre eles.
 Qualitativa Ordinal - os valores representam
atributos ou qualidades que possuem uma
relação de ordem
 Quantitativa Continua - valores são medidos
numa escala métrica, onde todos os valores
fracionários são possíveis.
 Quantitativa Discreta - valores são medidos
numa escala métrica e porem só admitem valores
inteiros
• Nominal: sexo, cor

Qualitativa • Ordinal: classe social, grau de


instrução

• Contínua: peso, altura, salário, idade


• Discreta: número de filhos, números
Quantitativa de eletrodomésticos em casa
 2.1 - Definição
 2.1.1 Dados Brutos
 2.1.2 Rol
 2.2 - Tabelas
 Dados brutos: dados coletados na fase 4 do
método estatístico. São a relação dos dados
obtidos na pesquisa sem nenhuma
ordenação.
 Ex: Notas de 50 alunos
 7-6-8-9-6-5-7-4-6-8-9-8-7-6-10-8-4-
5-6-10-5-8-4-3-8-7-9-6-10-7-7-7-9-5-
4-5-9-10-8-8-6-7-5-10-8-6-7-7-10-6.
 Rol: dados obtidos na fase de coleta
colocados em ordem numérica crescente ou
decrescente.
 Ex: Notas de 50 alunos
 3-4-4-4-4-5-5-5-5-5-5-6-6-6-6-6-6-6-
6-6-7-7-7-7-7-7-7-7-7-7-8-8-8-8-8-8-
8-8-8-9-9-9-9-9-10-10-10-10-10-10
 Frequência ou frequência absoluta: número
de vezes que um mesmo resultado acontece
durante uma pesquisa
 Ex: Tabela de Notas de 50 alunos
 Vantagens: Notas Frequencia
(f)
◦ Facilidade para analisar 3 1
os dados da pesquisa 4 4
5 6
6 9
7 10
8 9
9 5
10 6
 Ao realizarmos um teste de Estatística em
uma turma constituída de 40 alunos,
obtivemos os seguintes resultados (dados
brutos):
 7-6-8-7-6-4-5-7-7-8-5-10-6-7-8-5-10-
4-6-7-6-8-6-7-10-4-6-9-5-8-9-10-7-7-
5-9-10.
 Qual o resultado que aconteceu com a maior
frequência?
 Estrutura da tabela: Tabela de Notas dos Alunos
◦ Cabeçalho: Notas* Frequencia (f)
informações sobre o 3 1
que a tabela sintetiza 4 4
◦ Corpo: linhas e 5 6
colunas onde são
6 9
apresentados os
dados apurados na 7 10
pesquisa 8 9
◦ Rodapé: informações 9 5
adicionais que 10 6
ajudam a esclarecer a
interpretação da * Valores das notas arredondados.
tabela Fonte: dados fornecidos pelo professor
 A representação gráfica das séries estatísticas
tem por finalidade representar os resultados
obtidos, permitindo que se chegue a
conclusões sobre a evolução do fenômeno ou
sobre como se relacionam os valores da série.

 Características desejáveis:
 Simplicidade
 Clareza
 Veracidade
 O título do gráfico deve ser o mais claro e
completo possível. Quando necessário,
deve-se acrescentar subtítulos;
 A orientação geral dos gráficos deve ser da
esquerda para a direita;
 As quantidades devem ser representadas
por grandezas lineares;
 Sempre que possível, a escala vertical há de
ser escolhida de modo a aparecer a linha 0
(zero);
 Só devem ser incluídas no desenho as
coordenadas indispensáveis para guiar o
olhar do leitor ao longo da leitura. Um
tracejado muito cerrado dificulta o exame
do gráfico;
 A escala horizontal deve ser lida da
esquerda para a direita, e a vertical de
baixo para cima;
 Os títulos e marcações do gráfico devem ser
dispostos de maneira que sejam facilmente
lidos, partindo da margem horizontal
inferior ou da margem esquerda.
 Gráfico em Linhas
 Constitui uma aplicação do processo de
representação das funções num sistema de
coordenadas cartesianas
 Exemplo: Vendas em Cr$ 1000,00 nos anos
de 1971 a 1977 de determinado produto da
empresa x.
 Gráfico em Colunas
 É a representação de uma série por meio de
retângulos, dispostos verticalmente.
 Exemplo:População Brasileira nas décadas de
40 a 70.
 Gráfico em Barras
 É semelhante ao gráfico em colunas, porém,
os retângulos são dispostos horizontalmente.
 Exemplo:População Brasileira nas décadas de
40 a 70
Gráfico em Colunas

Gráfico em Barras
 Gráfico em Setores
 É a representação gráfica de uma série
estatística em círculo, por meio de setores.
 É utilizado principalmente quando se
pretende comparar cada valor da série com o
 total.
 Exemplo:
 Gráfico Polar
 É o gráfico ideal para representar séries temporais cíclicas,
isto é, séries que apresentam em seu desenvolvimento
determinada periodicidade, como, por exemplo, a variação da
precipitação pluviométrica ao longo do ano, ou da
temperatura ao longo do dia, o consumo de energia elétrica
durante o mês ou o ano, etc.
 Gráfico em Linhas
 Constitui uma aplicação do processo de
representação das funções num sistema de
coordenadas cartesianas
 Exemplo: Vendas em Cr$ 1000,00 nos anos
de 1971 a 1977 de determinado produto da
empresa x.
 Ao final da terceira semana de aula, o aluno
deve ser capaz de identificar as tabelas
estatísticas de distribuição de frequências,
determinar os diversos tipos de frequências e
desenvolver a primeira medida de posição: a
média.
 2.3 - Tipos de frequências
 2.3.1 Frequências Acumuladas
 2.3.2 Determinação do numero de classes e
intervalos
 Frequência Notas Frequencia (fa)
acumulada (fa) é o (f)

somatório das 3 1 1

frequências dos 4 4 1+4=5

valores inferiores ou 5 6 5+6=11

iguais ao valor 6 9 11+9=20

dado. 7 10 20+10=30
8 9 30+9 = 39
 20 alunos tiraram
9 5 39+5 = 44
nota < ou = a 6
10 6 44+6 = 50
 30 alunos tiraram
nota > que 6
 A frequência relativa é o resultado obtido da
divisão entre a frequência absoluta e a
quantidade de elementos da população.
Geralmente é apresentada na forma de
percentagem. Notas f (fr)
3 1 1/50=0,02
fr = f / n , onde n é a
4 4 4/50=0,08
quantidade de elementos da
5 6 6/50=0,12
população ou amostra.
Ex: 6 9 9/50=0,18
7 10 10/50=0,20
8 9 9/50=0,18
9 5 5/50=0,10
10 6 6/50=0,12
n 50 50/50= 1
 Quando o número de resultados obtidos em
uma pesquisa é demasiadamente grande, é
comum agruparmos esses resultados em
faixas de valores, denominadas de classes ou
intervalos.
 Por exemplo, se um pesquisador deseja saber
a idade das pessoas pesquisadas, ele as
distribui em faixas etárias.
 Ex: Tabela de Faixa Etária de Alunos da Turma de Estatística
Faixa Etária Alunos (f)
19-25
26-30
30-45
 Limites Inferiores (Li): Normalmente são incluídos
na faixa de valores.
 Limites Superiores (Ls): Normalmente não são
incluídos na faixa de valores.

 Ex:
 0|--- 5 anos . Faixa de 0,1,2,3,4 anos
 5|----10 anos. Faixa de 5,6,7,8,9 anos

 A distribuição em classes é utilizada quando a


população é muito grande com muitos valores
diversos para representar.
 Quantas classes deve ter uma tabela?
 Mínimo: 5 classes
 Máximo: 20 classes
 A Regra de Sturges, que nos dá o número de
classes em função do número de valores da
variável: k = 1 + 3,3 x log(n) onde n é o
número de itens da amostra
 Se n <26 k = 5, senão k = n
 Ex. n = 40, k = 1 + 3,3log(40) = 6,28 = 6
 40>26 => k = 40 = 6,3 = 6
 Amplitude (A) dos intervalos: diferença entre
o valor do Limite Superior (Ls) e o Limite
Inferior (Li)
 Ponto Médio do Intervalo (Pm)
 Pm = (Ls + Li ) / 2
 Ex:
 0|--- 5 anos . Faixa de 0,1,2,3,4 anos
 5|----10 anos. Faixa de 5,6,7,8,9 anos
 Amplitude (A) = 10 – 5 = 5
 Pm = (10 + 5) / 2 = 7,5
 O que é “população” para a estatística?
Elabore uma definição.

 O que é “amostra” para a estatística? Elabore


uma definição.

 Por que não podemos ter 100% de certeza


que os dados estatísticos sejam verdadeiros?
 Marque a opção que melhor define estatística
descritiva:
 a) é o cálculo de medidas que permite
descrever, com detalhes o fenômeno que está
sendo analisado.
 b) é a parte da estatística referente à coleta e
à tabulação dos dados
 c) é a parte da estatística referente às
conclusões sobre as fontes de dados
 d) é a generalização das conclusões sobre as
fontes de dados.
 Marque a opção que melhor define estatística
indutiva:
 a) é o cálculo de medidas que permite
descrever, com detalhes o fenômeno que está
sendo analisado.
 b) é a parte da estatística referente à coleta e
à tabulação dos dados
 c) é a parte da estatística referente às
conclusões sobre as fontes de dados
 d) é a generalização das conclusões sobre as
fontes de dados.
 Assinale V (Verdade) ou F (Falso). São duas
fases do método estatístico:
 ( ) Criar um problema e coletar dados
 ( ) Criar um problema e analisar dados
 ( ) Planejar um problema e coletar dados
 ( ) Coletar dados e analisar dados
 ( ) Apurar os dados e analisar um problema
 Quais são os limites inferiores e superiores
das classes da tabela 5?
 Calcule o Ponto Médio e Amplitude das
classes
 Livro Estatística Aplicada a Todos os Níveis
 Pag 54 a 56

Vous aimerez peut-être aussi