Académique Documents
Professionnel Documents
Culture Documents
MOQ-13/PO-210:
Probabilidade e Estatstica
Profa. Denise Beatriz Ferrari
www.mec.ita.br/denise
denise@ita.br
2o. semestre/2017
SEMANA 01: Roteiro
I Motivao
I Apresentao do Curso
I Plano da Disciplina
I Recursos Computacionais
Motivao
Data Revolution
4 / 57
Data Revolution
https://www.youtube.com/watch?v=r6v15Z60eUI
www.thehumanfaceofbigdata.com
5 / 57
Data Revolution
Big data
Small data
Linked data
Open data ...
... All Data!
6 / 57
From Big Data to Smart Data
7 / 57
From Big Data to Smart Data
7 / 57
Como gerar valor?
8 / 57
Habilidades mais buscadas por
data active companies:
I Conhecimento da rea
Quais os processosreais que geram os dados?
Quais as limitaes dos dados?
Que perguntas os dados permitem responder?
I Combinao de habilidades
computacionais e analticas
programao (obteno e manipulao de dados)
anlise (extrao de significado)
http://www.nesta.org.uk/publications/skills-datavores-talent-and-data-revolution
9 / 57
Datavores Report (cont.)
10 / 57
Apresentao do Curso
O QUE ESTATSTICA?
12 / 57
O que Estatstica?
Uso comum...
13 / 57
O que Estatstica?
Definies de livros...
14 / 57
O que Estatstica?
Entendimento contemporneo...
15 / 57
ESTATSTICA
CINCIA
DO
(Frequentista Bayesiana)
16 / 57
Estatstica em Engenharia
Exemplos:
I confiabilidade de aeronaves e seus subsistemas
I anlise do tempo de vida de componentes aeronuticos
I anlise de falhas
I limites de tolerncia
17 / 57
Estatstica Em Engenharia
O Mtodo Cientfico
18 / 57
Estatstica em Engenharia
Descrio e Anlise de Incertezas
19 / 57
Um pouco de histria
20 / 57
Um pouco de histria
21 / 57
Neste curso...
MOQ-13 / PO-210 / MB-210
22 / 57
Plano da Disciplina
Semana Contedo
1 Apresentao da disciplina. Recursos Computacionais.
2 Introduo teoria de probabilidades. Clculo de probabilidades.
3 Probabilidade condicional e independncia. Teoremas de Probabilidade (TP Total, T. Bayes).
4 Variveis aleatrias - parte I.
5 Variveis aleatrias - parte II.
6 1a. Prova Bimestral
7 Distribuies notveis - parte I.
8 Distribuies notveis - parte II.
9 Distribuies notveis - parte III.
10 2a. Prova Bimestral
11 Princpios de Estatstica. Distribuies amostrais. Teorema do Limite Central.
12 Inferncia estatstica: estimao pontual.
13 Inferncia estatstica: estimao via intervalos de confiana.
14 Inferncia estatstica: teoria da deciso (testes de hipteses).
15 Feriado
16 Tpicos adicionais. Encerramento do curso.
EX1 Exame final
24 / 57
Material de Estudo
Notas de aula
Sries de exerccios
Programas computacionais utilizando a linguagem R
Textos de apoio/vdeos
Bibliografia Principal:
1. Devore, JL (2014).
Probabilidade e Estatstica para Engenharia e Cincias,8a. Ed, Cengage Learning.
Bibliografia Complementar:
1. Zuur, AF; Ieno, EN; Meesters, EHWG (2009).
A Beginners Guide to R, Springer.
2. Verzani, J (2005).
Using R for Introductory Statistics, CRC Press.
3. Horton, NJ; Kleinman, K (2011).
Using R for Data Management, Statistical Analysis, and Graphics, CRC Press.
25 / 57
Equipe
Professores:
Monitores:
?
?
Participaes Especiais:
Equipe do ITA
outros ?
26 / 57
Obrigaes dos Professores
I Educao
I Respeito
I Propenso ao Dilogo
I DC
I Esforo para fazer o melhor possvel
I Demais obrigaes tpicas da funo PROFESSOR
27 / 57
Obrigaes dos Alunos
I Educao
I Respeito
I Propenso ao Dilogo
I DC
I Esforo para fazer o melhor possvel
I Demais obrigaes tpicas da funo ALUNO
28 / 57
Avaliao
Provas Bimestrais:
B1: S06 (06/set/2017)
B2: S10 (11/out/2017)
Exame Final
NBi = 0, 90 Pi + 0, 10 MQi i = 1, 2
onde:
29 / 57
Elementos Fundamentais em Estatstica
Elementos Fundamentais em Estatstica
Dados e Fontes de Dados
Dados
Populao: conjunto de dados (normalmente grande, ou apenas conceitual)
que caracteriza o fenmeno de interesse.
Amostra: subconjunto de dados selecionados a partir da populao de
interesse, de forma representativa.
Fontes de Dados
Primrias: a coleta dos dados faz parte do estudo
experimentos planejados
estudos observacionais
Secundrias: os dados so obtidos a partir de outras fontes publicadas
(relatrios, peridicos, publicaes oficiais etc.)
31 / 57
Elementos Fundamentais em Estatstica
Observaes e Variveis
32 / 57
Fundamentos da Anlise Exploratria de Dados
Mtodos para Explorao, Resumo e Descrio de Dados
Tentar obter informao a partir de dados tabulados nem sempre uma tarefa simples
(especialmente para conjuntos de dados grandes big data).
34 / 57
Ferramentas Descritivas para Dados Qualitativos
Exemplo:
Fonte: "Safety of nuclear power reactors". Nuclear Issues Briefing Paper 14, November 2004.
35 / 57
Ferramentas Grficas para Descrio de Dados Quantitativos
I Grfico de totais
I Histogramas
Nmero de classes em Histogramas
No. de observaes No. de classes
< 25 56
25 50 7 14
> 50 15 20
36 / 57
Ferramentas Numricas para Descrio de Dados Quantitativos
37 / 57
Ferramentas Numricas para Descrio de Dados Quantitativos
Medidas de Localizao (Centro)
I mdia (aritmtica) Pn Pn
mdia amostral: X = n1 i=1 Xi mdia populacional: = n1 i=1 Xi
ponto de equilbrio (centro de massa) => sensvel a assimetrias (skewness, cauda)
I mediana
resistente presena de pontos extremos
I moda
uso menos frequente (exceto em situaes em que a frequncia relativa de
ocorrncia importante)
38 / 57
Ferramentas Numricas para Descrio de Dados Quantitativos
Medidas de Disperso (Variao)
39 / 57
Ferramentas Numricas para Descrio de Dados Quantitativos
Medidas de Posio Relativa
I Quantis/percentis I Escores-z
medida da posio de uma observao
em nmeros de desvio-padro com
relao mdia. amostral:
X X
z=
s
populacional:
X
z=
40 / 57
Deteco de Outliers (observaes extremas)
41 / 57
Recursos Computacionais
Recursos Computacionais
Software Estatstico R
Com o R podemos...
I fazer clculos
I realizar anlises estatsticas
I gerar grficos de excelente qualidade
I construir funes e programas para necessidades especficas
1
Zuur et al. (2009) A Beginners Guide to R. Use R! Springer
43 / 57
Por que aprender R?
I Custo ($0)
I Disponibilidade para as plataformas UNIX, Windows, MacOS, online
I Software Livre
I Possibilidade de criar e compartilhar pacotes
I Contm implementaes de mtodos avanados, no facilmente encontrados em
outros programas estatsticos (proprietrios)
I Capacidade de produo de grficos de qualidade
I amplamente utilizado no apenas na academia, mas em empresas e instituies
como NASA, Google, New York Times, Pfizer, Bank of America, Merck, Nestl,
Shell, Ebay, Samsumg, Honda, Hyundai, GE etc.
44 / 57
Preparando o Ambiente
Instalar R e RStudio
45 / 57
Preparando o Ambiente
Iniciando uma Sesso
46 / 57
Operaes aritmticas em R
47 / 57
Operaes lgicas em R
48 / 57
Funes pr-definidas
> exp(1)
[1] 2.718282 R calcula valores numricos com preciso elevada.
Porm, est pr-programado para representar apenas 7
> pi dgitos significativos. Esta opo pode ser modificada
[1] 3.141593 utilizando a funo options(digits=x):
49 / 57
Constantes pr-definidas
I Valores especiais:
NaN not a number (0/0)
NA valor faltante (desconhecido)
NULL valor indefinido (objeto nulo)
Inf ou -Inf infinito (1/0, -1/0)
pi 3.141593...
I Outras:
LETTERS A, B, ..., Z
letters a, b, ..., z
month.abb Jan, Feb, ..., Dec
month.name January, February, ..., December
50 / 57
Buscando ajuda
> help("sqrt")
> help.search("sqrt")
Obs. Por se tratar de um software livre, existe uma grande grande quantidade de
informao disponvel na internet, no entanto pode ser difcil encontr-la (R, alm de
ser o nome do software tambm uma letra do alfabeto, portanto presente em diversos
sites).
O buscador http://www.rseek.org/ restringe a busca para os sites que possuem
contedo relacionado apenas linguagem R.
51 / 57
52 / 57
Variveis
53 / 57
Objetos
> x <- 5 + 7; y <- sqrt(4) Ponto e vrgula (;) separa comandos distintos.
> z <- xy
O comando rm(list=ls()) remove todos os
> ls()
objetos da rea de trabalho:
[1] x y z
54 / 57
55 / 57
Statistical thinking will one day be as necessary for efficient citizenship as the
ability to read and write. (H.G. Wells, 1946)
56 / 57
OBRIGADA
Denise B. Ferrari
denise@ita.br
2017