Vous êtes sur la page 1sur 28

Mtodos Quantitativos

PROF. DR. Renato Vicente

Aula 6A

Reviso

Mtodo Estatstico
Amostra

Populao Estatstica Descritiva Inferncia Estatstica Teoria de Probabilidades

Linha do Tempo da Estatstica


1 Jogos de Azar Teoria de Evoluo Teoria de Probabilidades 2 3 Aritmtica do Estado Inferncia Estatstica Mtodos Noparamtricos

1 2000 aC 0 1000 1500 1750 1870

2 1930 1960 1980

Demografia Teoria de Erros Computadores Eletrnicos

Estatstica Descritiva: Variveis qualitativas

Classes de qualitativas: Setores, barras, barras, rosa de Nightingale

Estatstica Descritiva: Variveis quantitativas

Ranking do PIB (do mais pobre para o mais rico)

140 120 100 80 60 40 20 0 0 0,2 0,4 0,6 0,8 1 1,2 ndice de Desenvolvimento Humano

Quant X quant : Disperso

Estatstica Descritiva: Distribuies de variveis aleatrias


Histograma

Boxplot

Estatstica Descritiva: Resumindo informao


Rol dos dados

Histogramas ou tabelas de freqncia

Mdia e Desvio Padro Sumrio dos 5 nmeros: Min, Segundo Quartil (25%), Mediana (50%), Terceiro Quartil (75%), Mx + robusto Moda e Largura a Meia altura

Mtodo Estatstico
Amostra

Populao Estatstica Descritiva Inferncia Estatstica Teoria de Probabilidades

Probabilidades: Calculando Riscos de Extrapolao


Amostra real estimativa da mdia = x1

Populao Mdia desconhecida=x

Dada uma nica amostra de tamanho n, qual seria o intervalo que conteria a mdia populacional desconhecida em 95 % das vezes ?

Probabilidades: Calculando Riscos de Extrapolao


Amostras hipotticas do mesmo tamanho Amostra real Estimador= x1

Populao Grandeza desconhecida=x

1. Imaginamos um nmero bem grande de amostras aleatrias do mesmo tamanho. 2. Imaginamos que calculamos valores estimados em cada um delas. Estes valores estimados estariam distribudos em torno do valor desconhecido da grandeza. 3. A Teoria de Probabilidades nos permite ento descrever a distribuio destes valores.

Inferncia Estatstica
Amostra

Populao

Inferncia Estatstica

A teoria de probabilidades nos permite estimar a partir de uma amostra um intervalo com confiana definida para os valores na populao. Para isso calculamos um estimador de intervalo.

Inferncia Estatstica
Suponha que queiramos determinar a MDIA POPULACIONAL de uma quantidade. A amostra tem tamanho n. Calculamos a mdia amostral:

E o desvio padro amostral:

O intervalo de confiana :

c depende do nvel de confiana desejado e do nmero de dados n

Estatstica T
Quando a amostra for pequena teremos que fixar uma confiana (por exemplo, 95%) e procurarmos pelo valor de c em uma tabela conhecida como estatstica T.

http://www.dim.fm.usp.br/info/tabelat/tabelat.php

Por exemplo, nossa amostra de crnios etruscos tem n=4: 141 148 132 138 Digamos que desejamos estimar um intervalo com confiana 95% para a mdia da populao. Comeamos por calcular a mdia: Mdia=(141+148+132+138)/4 = 139,75 Calculamos em seguida o desvio padro amostral: DPA = 6,65

Estatstica T
Por exemplo, nossa amostra de crnios etruscos tem n=4: 141 148 132 138 Digamos que desejamos estimar um intervalo com confiana 95% para a mdia da populao. Comeamos por calcular a mdia: Mdia=(141+148+132+138)/4 = 139,75 Calculamos em seguida o desvio padro amostral: DPA = 6,65 O nmero de graus de liberdade n-1=3 (df=3). Consultando a tabela usamos t(0.975), pois queremos um intervalo com 2,5% em cada lado (95% no total, portanto). Na tabela obtemos t(0.975)= 3,18. Assim teremos o seguinte intervalo com confiana de 95%: 139,75-3,18*6,65/RAIZ(4) < MDIA POP < 139,75+3,18*6,65/RAIZ(4) IC_MdiaPop(95%) = [129,150]

Aula 6B

Regresso

Biometria: Regresso Linear


i x(i) y(i) 1 11.2 3.0 2 12.4 3.2 3 13.5 4.0 4 15.7 4.8 5 17.1 4.8 6 18.5 4.9 7 19.0 5.6

http://www.stat.wvu.edu/SRS/Modules/Applets/Regression/regression.html http://www.math.csusb.edu/faculty/stanton/probstat/regression.html

Regresso Linear
As distncias entre as observaes e a reta escolhida so aleatrias. A melhor reta aquela que minimiza a soma total destas distncias (mnimos quadrados) A qualidade do ajuste medida pelo R2 (quadrado da correlao de Pearson) que significa a frao da variao que explicada pelo ajuste. Assim R2=1 indica ajuste perfeito.
http://www.stat.wvu.edu/SRS/Modules/Applets/Regression/regression.html http://www.math.csusb.edu/faculty/stanton/probstat/regression.html

Aula 6C

Testes de Hipteses

Popper: Mtodo Indutivo


Em 1934 Karl Popper publicou a Lgica da Pesquisa Cientfica. Neste livro Popper procura delimitar hipteses cientficas a partir da propriedade de falseabilidade, ou seja, a partir da possibilidade de realizar-se um experimento que contradiga previses deduzidas de uma hiptese cientfica. H -> C1, C2, C3, ... Cn Como em geral no possvel verificar todos os experimentos possveis, no seria possvel provar uma hiptese. Mas apenas uma observao contraditria seria suficiente para rejeit-la. Tambm no possvel garantir que as mesmas consequncias no possam emergir de outras hipteses.

Teste de Significncia: valor p


Em 1925 Fisher publicou um livro que viria a ser o primeiro manual de mtodos estatsticos: Statistical Methods for Research Workers . Neste livro so apresentadas tcnicas para avaliao do VALOR-p, medida da probabilidade de obtermos resultados iguais ou mais extremos do que nossas observaes dado que uma HIPTESE NULA H0 seja verdadeira Quanto menor p, mais improvvel a observao se H0 for verdadeira. Ronald A Fisher (1890-1962) Se p< nvel de significncia (usualmente 5%) rejeitamos H0. Se p>5% no-rejeitamos H0. Poderia haver outra explicao, mas no h evidncia contra H0.
http://www.amstat.org/publications/jse/v16n3/pvalueapplet.html

Neyman e Egon Pearson: Testes de Hipteses


Neyman e Pearson (filho de Karl Pearson, odiado por R.A. Fisher) notaram que os testes de significncia podem ser aplicados de forma mais efetiva quando a Hiptese nula comparada uma Hiptese Alternativa. Egon Pearson (1895-1980)

Jerzy Neyman (1894-1981)

http://www.amstat.org/publications/jse/v16n3/pvalueapplet.html

Comparando mdias: Teste T

Grupo controle

Grupo em tratamento

Suponhamos duas amostras em um experimento com dois tratamentos. AS distribuies amostrais so representadas acima

Comparando mdias: Teste T


variabilidade mdia variabilidade alta

variabilidade baixa

Dependendo da variabilidade observada a diferena entre mdias ser mais ou menos significativa.

Comparando mdias: Teste T


sinal rudo Diferena entre as mdias Variabilidade dos grupos

A estatstica T mede a relao sinal rudo da diferena entre as mdias amostrais . Aps calcular o valor t. Basta observar a significncia em uma tabela T. A Hiptese nula corresponde a mdias idnticas. A hiptese alternativa a mdias diferentes.

Tipos de Erros
Inocente Condenado Liberado Erro TIPO I Correto Culpado Correto Erro TIPO II

H0 verdadeira Rejeita H0 No rejeita H0 Erro TIPO I Correto

H1 verdadeira Correto Erro TIPO II

Tipos de Erros
http://www.intuitor.com/statistics/CurveApplet.html H0 verdadeira Rejeita H0 No rejeita H0 Erro TIPO I Correto inocente H1 verdadeira Correto Erro TIPO II culpado

Inocentes suspeitos

Criminoso s espertos com bons advogados

aparncia de culpa Tipo II Tipo I

Poder e Significncia de um Teste


H0 verdadeira Rejeita H0 No rejeita H0 Erro TIPO I Correto H1 verdadeira Correto Erro TIPO II

O poder de um teste a probabilidade de que o teste rejeite uma hiptese nula falsa. Ou seja a probabilidade de que H1 seja julgada verdadeira quando realmente for verdadeira. Alternativamente a chance de que o teste no cometa um erro do Tipo II, ou seja ser 1-=1-P(Erro Tipo II). A probabilidade de erros do tipo I a significncia do teste =P(Erro Tipo I). Normalmente fixa-se primeiro a significncia (1% ou 5%), a partir disso define-se o intervalo de rejeio da hiptese nula. O poder do teste conseqncia desta escolha, do tamanho da amostra e da prpria amostra. Testes com poder muito baixo so pouco informativos. http://www.intuitor.com/statistics/CurveApplet.html