Vous êtes sur la page 1sur 88

PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SUL

ESCOLA DE CIÊNCIAS

PROBABILIDADE & ESTATÍSTICA


Prof. Hélio Radke Bittencourt 2019/1

1. CONCEITOS BÁSICOS DE ESTATÍSTICA


1.1 Conjuntos de dados. População e Amostra
1.2 Tipos de variáveis
1.3 Escalas de mensuração
1.4 Estatística descritiva e inferencial

2. ESTATÍSTICA DESCRITIVA
2.1 Tabelas de freqüência simples e cruzadas
2.2 Análise gráfica
2.3 Medidas de Tendência Central
2.4 Separatrizes
2.5 Medidas de Variabilidade

3. PROBABILIDADE
3.1 Experimentos, Espaço Amostral e Eventos
3.2 Operações com eventos
3.3 Conceitos de Probabilidade
3.4 Probabilidade Condicional e Independência
3.5 Teorema de Bayes
3.6 Variáveis aleatórias discretas
3.7 Principais modelos discretos
3.8 Variáveis aleatórias contínuas
3.9 Principais modelos contínuos

4. AMOSTRAGEM
4.1 Conceitos básicos
4.2 Principais técnicas de amostragem probabilística

5. DISTRIBUIÇOES AMOSTRAIS E ESTIMAÇÃO


5.1 Parâmetros e Estimadores
5.2 Distribuição amostral da média
5.3 Estimação por ponto
5.4 Estimação por intervalos de confiança

6. TESTES DE HIPÓTESES
6.1 Teste t de Student para uma média
6.2 Testes t de Student - duas amostras independentes
6.3 Análise de Variância (ANOVA)
6.4 Teste Qui-quadrado

7. CORRELAÇÃO E REGRESSÃO
7.1 Coeficiente de correlação de Pearson
7.2 Regressão Linear Simples
7.3 Regressão Linear Múltipla
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 2

Cap. 1. CONCEITOS BÁSICOS DE ESTATÍSTICA

1.1 Conjunto de dados. População e amostra

A Estatística pode ser definida como o conjunto de ferramentas para coleta,


organização, análise e interpretação de dados experimentais. O objeto de estudo em
Estatística é um conjunto de dados que pode constituir uma população ou uma
amostra.

População é um conjunto finito ou infinito de elementos.

Amostra é um subconjunto da população. Geralmente buscamos amostras


representativas. Uma amostra representativa é aquela que mantém as
características da população.

1.2 Tipos de Variáveis

Em estatística não trabalhamos diretamente com os elementos que formam o conjunto


de dados, mas sim com suas características. Variáveis são características dos
elementos que formam o conjunto de dados.

As variáveis podem ser classificadas em qualitativas ou quantitativas: as variáveis


qualitativas expressam uma classificação em categorias e, por isso, também são
chamadas de categóricas. As variáveis quantitativas expressam quantidades numéricas
e se dividem em discretas e contínuas. As variáveis discretas assumem apenas
determinados valores num dado conjunto enumerável, enquanto as variáveis contínuas
podem assumir, ao menos teoricamente, qualquer valor num dado intervalo numérico.

Exemplo – Listar variáveis qualitativas e quantitativas para um laptop

Na prática todas as variáveis são discretas, devido à limitação dos instrumentos de


mensuração.
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 3

1.3 Escalas de Mensuração

As variáveis ainda podem ser classificadas de acordo com o nível ou escala de


mensuração: Nominal, Ordinal ou Intervalar/Razão.

O nível nominal de mensuração é caracterizado por números que apenas


diferenciam ou rotulam as categorias.

Exemplos: Sexo (1-M, 2-F), Estado Civil, Naturalidade, Curso.

O nível ordinal de mensuração envolve números que, além de diferenciar,


hierarquizam as categorias. Também são chamadas de escalas Likert em homenagem
ao americano Rensis Likert que publicou o artigo "A Technique for the measurement of
attitudes" em 1932, onde sugeriu escalas de 5 pontos com uma categoria neutra ao
centro.

Exemplos: Nível de satisfação, Nível de concordância, Escala de Avaliação, Níveis de


solubilidade.

O nível intervalar ou de razão apresenta números que expressam diretamente uma


quantidade seguindo uma métrica. Podemos tranqüilamente realizar operações
matemáticas com variáveis deste tipo.

Exemplos: Temperatura, tamanho de objetos, pesos, contagens.

Figura – Resumo dos tipos de variáveis e escalas de mensuração


Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 4

1.4 Estatística Descritiva e Inferencial

A estatística é um conjunto de ferramentas utilizadas para a coleta, tabulação, análise e


interpretação de um conjunto de dados experimentais. A Estatística pode ser dividida
em duas grandes áreas: Descritiva e Inferencial.

A estatística descritiva é aquela que costumamos encontrar com maior freqüência


em jornais, revistas, relatórios, etc. Essa parte da estatística utiliza números para
descrever fatos. Seu foco é a representação gráfica e o resumo e organização de um
conjunto de dados, com a finalidade de simplificar informações. Nessa categoria se
enquadram as médias salariais, taxas de inflação, índice de desemprego, etc.

A estatística inferencial consiste na obtenção de resultados que possam ser


projetados para toda população a partir de uma amostra da mesma. Ela fundamenta-se
na teoria da amostragem e no cálculo de Probabilidades. Essa é a área mais importante
da Estatística.

Figura - Esquema geral de um curso de Estatística

Descritiva

Estatística

Inferencial

Probabilidade Amostragem
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 5

Cap. 2 ESTATÍSTICA DESCRITIVA

2.1 Tabelas de freqüência simples e cruzadas


Vamos introduzir o tema de tabelas de freqüência simples construindo tabelas para o
banco de dados coletado em sala de aula:

Exemplo 1 – Banco de dados coletado em sala de aula

Aluno Sexo Semestre Nº pessoas Nº contas de Altura (cm)


(M ou F) domicílio email

Criar uma tabela de freqüências para cada uma das variáveis.

Tabelas de freqüência são encontradas em jornais informativos (Zero Hora, Correio do


Povo, etc.), relatórios técnicos, monografias, dissertações, teses e revistas científicas.
As tabelas de freqüência simples apresentam de forma concisa o número de
ocorrências (absoluta e relativa) dos valores de uma variável.

Uma tabela de freqüência genérica tem a seguinte configuração:

Tabela 1 – Tabela de freqüências genérica


i xi fi fri
1 x1 f1 fr1
2 x2 f2 fr2
   
k xk fk frk
 n 100,0%
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 6

A notação utilizada é a seguinte:

X é uma variável qualquer


x é um particular valor da variável X
i é um índice útil para enunciar as expressões matemáticas
k é o número de linhas da tabela

Os componentes da tabela de freqüências são:

Freqüência absoluta (fi): número de ocorrências do valor xi.

Freqüência relativa (fri): percentual de ocorrências do valor xi

Freqüência absoluta acumulada (Fi): número de ocorrências até o valor xi.

Freqüência relativa acumulada (Fri): percentual de ocorrências até o valor xi

As Tabelas cruzadas apresentam a distribuição de freqüências de duas variáveis


simultaneamente. As tabelas cruzadas são abundantes em jornais e revistas
especializadas.

Exemplo 2 – Tabela Cruzada 2X2

Matriz de confusão / Tabela de classificação

Classificação
Realidade Sem
Mudanças Total
mudanças
Sem mudanças 80 20 100
Mudanças 5 45 50
Total 85 65 150
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 7

2.2 Análise Gráfica

O tipo de gráfico adequado para cada variável depende do tipo de variável. Segue uma
relação de exemplos de variáveis e tipos de gráficos adequados.

Variável Qualitativa Nominal (com poucas categorias)

GRÁFICO DE SETORES (Pizza ou Torta)

Figura – Distribuição da turma por sexo

Masculino
40%

Feminino
60%

Base: 50 alunos de uma turma


Fonte: dados coletados em aula (numa turma, obviamente, não de CC)

Variável Qualitativa Nominal (com muitas categorias):

GRÁFICO DE BARRAS

Figura – Principais causas de morte - EUA

Cigarro 37,7%

Obesidade 28,3%

Ãlcool 9,4%

Doenças infecciosas 8,5%

Armas de fogo 3,3%

Doenças venéreas 2,8%

Acidente de carro 2,4%

Drogas 1,9%

Outras 5,7%

0% 20% 40% 60% 80% 100%

Base: ???
Fonte: TE Estatísticas, ano não declarado
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 8

Variável Qualitativa Ordinal:

GRÁFICO DE BARRAS

Figura – Avaliação do atendimento da equipe de um call-center

Ótimo 25%

Muito Bom 35%


Avaliação

Bom 20%

Regular 8%

Ruim 5%

Péssimo 2%

0% 10% 20% 30% 40%


%

Base: 100 usuários


Fonte: Dados fictícios.

Variável Quantitativa Discreta

GRÁFICO DE COLUNAS

Figura – Número de pessoas por domicílio

100,0%
80,0%
60,0%
35,0%
40,0% 25,0%
20,0%
20,0% 12,5%
7,5%
0,0%
1 2 3 4 5
Número de pessoas por domicílio

Base: 40 domicílios
Fonte: Dados coletados numa turma de Estatística
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 9

Variável Quantitativa Contínua

HISTOGRAMA

Figura – Distribuição de uma turma por altura

10

4
Freqüência

0
150 ,0 160 ,0 170 ,0 180 ,0 190 ,0 200 ,0

Altura (cm)

Base: 20 observações
Fonte: Alunos de uma turma de Estatística I. Gráfico construído no software SPSS.
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 10

2.3 Medidas de Tendência Central

São valores que trazem informação sobre a região em torno da qual os dados estão
posicionados. As medidas de tendência central mais utilizadas são: Média, Mediana e
Moda.

2.3.1 – Média Aritmética ( , X )

A média aritmética é definida como a soma de todas observações da variável X,


dividida pelo número de elementos do conjunto de dados. Freqüentemente a média
aritmética é o valor que melhor representa um conjunto de dados.

Quando os dados não estão organizados na forma de uma tabela de freqüências e,


portanto, estão na forma isolada, as expressões genéricas para encontrar a média
são:

População Amostra

N n

 xi x i
 i 1
X  i 1

N n

Quando os dados estão organizados na forma de uma tabela de freqüências deve-se


ponderar os diferentes valores xi pelas respectivas freqüências fi. Procedendo desta
forma o cálculo da média aritmética torna-se mais simples e rápido.

População Amostra

k k

 xi  f i x i  fi
 i 1
X  i 1

N n

Exemplo 3 – Número de disciplinas cursadas no semestre

Encontrar a média para o número de disciplinas cursadas no semestre.


Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 11

2.3.2 – Mediana (Md)

A mediana é o valor que divide o conjunto de dados ordenado em duas partes com
igual número de observações. Para calcular a mediana iremos utilizar uma nova
notação. Seja x[1] , x[ 2] ,, x[ n ] um conjunto de dados ordenado (ordem crescente),
onde o valor entre colchetes representa a posição no conjunto ordenado.

Deduzindo a posição mediana:

n ímpar n par
n Fila Md n Fila Md
3 4

5 6

7 8

As expressões genéricas para encontrar a média são:

n ímpar n par

Quando os dados estão organizados na forma de uma tabela de freqüências pode-se


encontrar a posição mediana na coluna acumulada Fi.

Exemplo 4 – Número de disciplinas cursadas no semestre

Encontrar a mediana para o número de disciplinas cursadas no semestre.


Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 12

2.3.3 – Moda (Mo)

A moda é definida como o valor mais freqüente de um conjunto de dados. É possível


que o conjunto seja bimodal (duas modas) ou até mesmo multimodal (três os mais
modas).

Mo  xi com maior f i

Exemplo 5 – Número de disciplinas cursadas no semestre

Encontrar a moda para o número de disciplinas cursadas no semestre.

Considerações IMPORTANTES sobre as MTC

1. A média é a MTC mais influenciada por valores extremos, entretanto é a medida


mais “rica”, porque considera todos valores do conjunto de dados.

2. A mediana não é afetada por valores extremos.

3. A moda é a MTC mais “pobre”, porque considera apenas os valores mais freqüentes.

4. Existem outros tipos de média usadas em ocasiões especiais. A média harmônica é


muito utilizada em concursos públicos e a geométrica pode ser usada em situações de
alta variabilidade, visto que ela é mais estável. Discutiremos isto em aula.

Média harmônica Média geométrica

n
Xh  n
X G  n x1  x2   xn
1

i 1 x i

Pode-se estabelecer a seguinte relação entre as médias:

Xh  XG  X
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 13

Exemplo – Desempenho no Vestibular

Veja os quatro candidatos a seguir e seus respectivos desempenhos no vestibular.


Comente sobre a ação das médias.

Tabela – Desempenho de quatro alunos no vestibular


Aluno A Aluno B Aluno C Aluno D
Química 500 498 410 580
Física 500 502 405 580
Matemática 500 500 415 580
Geografia 500 515 425 580
História 500 485 445 580
Português 500 500 900 100
Média Aritmética 500,0 500,0 500,0 500,0
Média Harmônica 500,0 499,8 460,5 322,2
Média Geométrica 500,0 499,9 476,7 432,7

a) Calcular as médias Aritmética e Harmônica e conferi-las no quadro acima.


Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 14

2.4 Separatrizes

São valores que separam o conjunto de dados ordenado em partes com igual número
de observações.

A Mediana é, portanto, uma separatriz porque divide o conjunto de dados em duas


partes iguais.

Min |------------------------|------------------------| Máx


Md

Os Quartis (Qi) dividem o conjunto de dados em 4 partes iguais.

Min |------------------------|------------------------| Máx

Os Percentis (Pi) dividem o conjunto de dados em 100 partes iguais.

Min |------------------------|------------------------| Máx

Exemplo 6 – Boletim de Desempenho do Provão do MEC

Exemplo 7 – Distribuição de Renda no Brasil

A régua de percentis a seguir apresenta a distribuição de renda per capita para a


população do Brasil todo no ano de 2012.

R$6000
R$ 286 R$ 533 R$ 936 R$ 1681 R$2600
Min|-----------|-------------|-------------|---------|----|---|--| Max
P25 P50 P75 P90 P95 P99
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 15

2.5 Medidas de Variabilidade

São medidas que complementam as MTC trazendo informação sobre a dispersão


existente no conjunto de dados. Para introduzi-las vamos recorrer a um exemplo onde
temos três diferentes processadores e o tempo necessário por eles para realizar uma
tarefa.

Exemplo 8 – Entendendo as Medidas de Variabilidade

Tabela – Tempos de processamento (ms)


Processador Processador Processador
Alfa ® Beta ® Gama ®
120 118 120
120 121 100
120 124 135
120 117 155
120 120 120
120 120 90
Média ( X )
Moda (Mo)
Mediana (Md)

Questões

1 – O que aconteceu com as MTC na tabela acima?

2 – Os três processadores são iguais em relação ao tempo de processamento?

3 – O que diferencia um processador do outro?

A partir de agora aprenderemos a calcular medidas capazes de quantificar a


variabilidade existente num conjunto de dados
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 16

2.5.1 – Amplitude (R, do termo Range)

É a diferença entre o maior e o menor valor de um conjunto de dados.

R  máxxi   mínxi 

Calcular R nos três processadores do Exemplo 8.

2.5.2 – Variância (2 , s 2)

A variância é uma medida da variação em torno da média. Por definição,


variância é a média dos quadrados dos desvios em torno da média.

População Amostra

 x  X
N n

 x  
2 2
i i
2  i 1
s2  i 1

N n 1

A variância, ao contrário da Amplitude, considera todos elementos do conjunto de


dados no seu cálculo. Quanto maior for a variação dos valores do conjunto de dados,
maior será a variância.

Quando os dados estão organizados na forma de uma tabela de freqüências, deve-


se ponderar os quadrados dos desvios pela freqüência. Esse procedimento facilita o
cálculo.

População Amostra

 x  X   fi
k k

 x     fi
2 2
i i
2  i 1
s2  i 1

N n 1

Calcular s2 nos três processadores do Exemplo 8.


Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 17

2.5.3 – Desvio-padrão (, s)

O desvio-padrão é a raiz quadrada positiva da variância. Essa medida corrige o


problema de unidade que surge na variância. O desvio-padrão também é uma
medida da variação em torno da média.

População Amostra
   2
s  s2

O desvio-padrão expressa a variação média do conjunto de dados em torno da média,


para mais ou para menos.

Calcular s nos três processadores do Exemplo 8.

2.5.4 – Coeficiente de Variação (CV)

O CV é a razão entre o desvio-padrão e a média de um conjunto de dados. Ele expressa


a variação relativa (%) presente no conjunto de dados em relação à média.

População Amostra
 s
CV   100% CV   100%
 X

Quanto maior o CV, mais heterogêneos serão os dados.

Calcular o CV nos três processadores do Exemplo 8.


Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 18

Considerações sobre as Medidas de Variabilidade (MV)

1. A Amplitude á a MV mais “pobre”, porque considera apenas os dois valores


extremos do conjunto de dados.

2. A Variância não é interpretada na prática devido ao problema da unidade, que está


ao quadrado.

3. O Desvio-padrão é a MV mais conhecida, sendo amplamente utilizada.

4. Dentre as MV estudadas, sugere-se que o CV seja utilizado para comparação da


variabilidade entre diferentes conjuntos de dados. Por não ter unidade, o CV pode ser
utilizado até mesmo para comparar a variabilidade entre variáveis expressas em
diferentes unidades.

Exemplo 9 – Número de pixels corretamente classificados

Suponha que numa amostra de 30 imagens de satélite de uma mesma região


submetidas ao mesmo classificador, os números de pixels classificados de forma errada
foram:

10 5 6 5 6 9 5 7 5 10
5 10 7 8 8 9 9 6 6 10
5 6 6 7 6 6 7 6 8 7

a) Construir uma tabela de freqüências para a variável X.

b) Encontrar e interpretar as MTC.

c) Calcular as Medidas de Variabilidade.


Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 19

Cap. 3 – Probabilidade

3.1 – Experimentos, Espaço Amostral e Eventos

Probabilidade é o ramo da matemática que trata de fenômenos aleatórios. A observação de


um fenômeno aleatório por parte do homem é chamada de experimento aleatório.

Características de um experimento aleatório:

1ª) Não se conhece um particular valor do experimento antes dele ser executado, porém
podemos descrever todos os possíveis resultados - as possibilidades;

2ª) Quando o experimento é repetido algumas vezes, os resultados ocorrem de uma forma
aparentemente acidental. Mas quando o número de repetições aumenta, uma regularidade
aparecerá. E esta regularidade que torna possível construir um modelo matemático útil para
análise do experimento.

Exemplos de fenômenos aleatórios:

1) Condições meteorológicas
2) Produção de arroz anual numa cidade
3) Mercado Financeiro
4) Lançamento de uma moeda
5) Resultados de loterias

Exemplos de experimentos aleatórios:

E1: Jogue um dado e observe o n.º na face de cima.


E2: Jogue uma moeda 3 vezes e observe o número de caras obtido.
E3: Jogue uma moeda 3 vezes e observe a seqüência de caras e coroas obtida.
E4: O estado (conforme, não-conforme) de três peças produzidas é verificado.
E5: O número de peças produzidas até a obtenção de uma defeituosa é anotado.
E6: A temperatura de uma máquina é verificada por um supervisor.

Nos seis exemplos anteriores não somos capazes de precisar o resultado, entretanto
conseguimos listar os possíveis resultados.

Espaço amostral de um experimento aleatório é o conjunto de todos os resultados possíveis


do experimento. É denotado por S ou . A cardinalidade do espaço amostra é denotada por #.
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 20

Exemplos de espaços amostrais relacionados aos experimentos anteriores.

S1 =

S2 =

S3 =

S4 =

S5 =

S6 =

Um evento é um subconjunto de S. Em particular, S e  (conjunto vazio) são eventos; S é dito


o evento certo e  o evento impossível.

Exemplo de eventos no lançamento de um dado

S = {1,2,3,4,5,6}

A: ocorre um n.º par A = {2,4,6}


B: ocorre a face 6 B = {6}
C: ocorre um n.º maior que 6 C=
D: ocorre nº 6 ou nº par D = {2,4,6}
E: ocorre nº par ou nº ímpar E = {1,2,3,4,5,6} = S

3.2 Operações com eventos

É possível realizar operações com eventos que nada mais são do que as operações com
conjuntos já estudadas no Ensino Fundamental.

Operações com eventos

Sejam A e B dois eventos associados a um espaço amostral S.

1) União: AB  A ocorre ou B ocorre ou ambos ocorrem

2) Interseção: AB  A ocorre e B ocorre

3) Complementar: Ac ou A  não ocorre A

Duas definições importantes:


Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 21

1) Dois eventos A e B são excludentes ou mutuamente exclusivos se a ocorrência de um


impedir a ocorrência de outro. Em outras palavras, não podem ocorrer simultaneamente, logo,
P(AB)=0.

2) Eventos ou resultados equiprováveis têm a mesma probabilidade de ocorrência. Se A e B


são equiprováveis, então P(A)=P(B).

Exemplo – Lançamento de um dado e uma moeda, ambos honestos

Escreva o espaço amostral. Os resultados são todos equiprováveis? Qual a probabilidade de um


particular par (x,y) ser selecionado. Assinale os seguintes eventos:

3.3 Conceitos de probabilidade

Os conceitos de probabilidade podem ser enunciados de três formas distintas. O conceito


clássico - simples e antigo; o conceito frequentista - baseado na observação e o conceito
moderno ou axiomático introduzido pelo russo Andrei Kolmogorov em 1933.

Considere P(A) = probabilidade de ocorrência do evento A.

 Conceito clássico

Esse conceito só é válido se todos resultados de S forem equiprováveis. Para casos assim a
probabilidade de ocorrência do evento A é obtida por:

n( A)
P( A)  n(A) é o número de resultados favoráveis ao evento A
Total ( S )
Total (s) é o número total de resultados em S

Exemplos – Conceito clássico

Mega-sena, Lançamento de moedas e dados honestos.


Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 22

 Conceito freqüentista

Neste conceito a probabilidade é tratada como um limite. Aqui é possível fazer uma relação
entre probabilidade (teórica) e estatística (empírica). Para casos assim a probabilidade de
ocorrência do evento A é obtida por:

1º) O experimento é repetido n vezes.

2º) Observa-se a freqüência relativa de ocorrência de um certo resultado A:

n( A)
fr(A) = , onde n(A) é o nº de vezes em que ocorre o resultado A em n realizações do
n
experimento.

3º) Probabilidade como limite. A medida que n aumenta, a fr(A) converge para a real
probabilidade P(A).
lim n fr ( A )  P( A )

Exemplos – Conceito freqüentista

1) Verificando se um dado é honesto.

2) Encontrando a probabilidade de ocorrência de um acidente aéreo.

3) Qual a probabilidade de uma criança nascer com Síndrome de Down ?

TAREFA 1: “Não dê o peixe, ensine a pescar”

Desenvolver um dado no EXCEL de forma que seja possível verificar o


funcionamento do Conceito Frequentista. Verifique se a fr(6) converge para 1/6 à
medida que n aumenta.

Dica: Veja como podemos fazer uma moeda no Excel e como contar quantas caras
ocorreu:

=SE(ALEATÓRIO()<0,5;”Cara”;”Coroa”)

Se o número aleatório entre 0 e 1 gerado pelo Excel for inferior a 0,5,então escreva “Cara”;
caso contrário escreva “Coroa”. Depois, copie e cole esta fórmula para as células A2 até A1000.

= CONT.SE(A2:A1000;”Cara”)

O Excel irá contar quantas vezes aparece a palavra “Cara” entre as células A1 e A1000.
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 23

 Conceito Axiomático

Os Axiomas da Probabilidade devem-se ao russo Kolmogorov. Seja A um evento de S. A


probabilidade de ocorrência de A, denotada por P(A), deverá satisfazer os seguintes axiomas
(propriedades fundamentais).

Axioma 1: 0  P(A)  1
Axioma 2: P(S) = 1
Axioma 3: Para eventos Ai excludentes, P(A1 A2) = P(A1) + P(A2)

3.4 Probabilidade Condicional e Independência

A probabilidade de ocorrência de um evento pode ser influenciada pela ocorrência de um


evento paralelo. Considere que A e B são eventos de um mesmo espaço amostral S.
Chamaremos de P(A|B) a probabilidade de ocorrência do evento A dado que o evento B já
ocorreu.

Graficamente:

Olhando para o desenho podemos estabelecer as seguintes relações:

P(A|B) = P(B|A) =

Exemplo – Escolhendo alguém na sala de aula

Suponha que um aluno da turma será sorteado. Após saber o resultado o professor faz algumas
perguntas utilizando probabilidade condicional.
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 24

Exemplo – Fornecedor X Devoluções

Devolução
Fornecedor Sim Não Total
A 30 50 80
B 60 40 100
C 50 50 100
Total 140 140 280

Resolver as seguintes probabilidades:

=> Independência

Dois eventos A e B são considerados independentes se a ocorrência de um não interfere na


probabilidade de ocorrência do outro:

P(A|B) = P(A) e P(B|A) = P(B)

Isolando a intersecção na expressão de probabilidade condicional obtemos:

P(AB) = P(A) x P(B)

Esse conceito é fundamental para aplicações em Estatística.

Exemplo – Lançamento de um dado e uma moeda, ambos honestos.

Exemplo – Três operadores diferentes realizam a mesma tarefa em máquinas distintas. Eles
produzem caixas com três peças, cada uma feita por um operado. A probabilidade do operador
A falhar é de 3/1000 ; do operador B 5/1000 e do operador C, 1/100.

Qual a probabilidade de haver pelo menos uma peça defeituosa nesta caixa?
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 25

3.5 Teorema de Bayes

Considere um espaço amostral formado por n eventos Ai excludentes de forma que


A1A2...An = S. Suponha que as probabilidades dos Ai´s sejam conhecidas bem como todas
as condicionais P(B|Ai). Será possível determinar a probabilidade P(Ai|B)?

Dedução da “Regra de Bayes”:

P( Ai  B ) P( Ai )  P( B | Ai )
P( Ai | B )    ...
P( B ) P( B )

Exemplo – Máquinas e não-conformidade

Uma empresa possui três máquinas (A,B,C) com as seguintes probabilidades de produção de
uma peça não-conforme (NC): 1%, 2% e 5%. A máquina A é responsável por 40% da
produção; a máquina B por 50% e a máquina C é responsável pelo restante.

a) Se uma peça não-conforme é encontrada, qual a probabilidade dela ter sido produzida pela
máquina A? Encontre as probabilidades para as máquinas B e C também.

b) Qual a probabilidade de uma peça não-conforme ser encontrada na produção conjunta?

Exemplo – Bayes numa tabela cruzada

Suponha uma sala de aula com 60 alunos, sendo 30 das Ciências da Computação, 20
da Engenharia Elétrica e 10 da Eng de Produção. Sabe-se que, nesta turma, 20 alunos
estão em G2, sendo 12 da CCO e seis da EEL. Sabendo que um aluno está em G2,
qual a probabilidade ele ser a Eng de Produção?
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 26

3.6 – Variáveis aleatórias discretas

3.6.1 Definições Básicas

Uma variável aleatória discreta X é uma função que associa números aos resultados do Espaço
Amostral.

Exemplo – Prova
Para exemplificar vamos admitir uma prova composta de n=4 questões com cinco alternativas
cada onde apenas uma está correta.

Q1) a) b) c) d) e)
Q2) a) b) c) d) e)
Q3) a) b) c) d) e)
Q4) a) b) c) d) e)

Escreva o espaço amostral S considerando apenas questão certa (C) ou errada (E).

S = { EEEE; CEEE; CCEE; CCCE; CCCC } onde temos 24 = 16


ECEE; CECE; CCEC;
EECE; CEEC; CECC;
EEEC; ECCE; ECCC;
ECEC
EECC

Agora considere X=número de acertos em cada ponto amostral de S. Logo, os valores possíveis
para X são 0,1,2,3 ou 4. O resultado EEEE implica em X=0; os resultados CEEE, ECEE, EECE,
EEEC implicam num X=1, etc.

A função de probabilidade de X, denotada por P(X=x) ou f(x), indica o comportamento


probabilístico de X.

Neste caso:

x 0 1 2 3 4

P(X=x)

Características da função de probabilidade:


1a) 0  P(X  x)  1
2a)  P( X
x
 x)  1

A função de probabilidade pode ser representada graficamente.


Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 27

A Função de probabilidade acumulada de X, denotada por F(X) ou P( X  x ) , indica a


probabilidade de ocorrerem valores menores ou iguais a x.

Características da F(X) ou P( X  x ) :
1a) Ela é contínua à direita;
2a) F (  )  0 e F (  )  1
3a) F ( x ) é sempre não decrescente.

Graficamente:

Esperança e Variância de uma Variável Aleatória Discreta

O valor esperado ou esperança de uma variável discreta é o seu “centro de equilíbrio”. É


uma média da variável X, mas do ponto de vista teórica, sem coleta de dados empíricos. A
esperança de uma variável discreta é calculada por:

E( X )   x  P( X  x )
x

Exemplo – Prova

Calcular o número esperado de acertos no caso da prova.

A variância de uma variável aleatória discreta indica a variabilidade em torno de sua média. A
expressão da variância pode ser melhor entendida se comparada a expressão da variância que
aprendemos em Estatística Descritiva:

   
Var( X )  E  X  E( X )    E X 2  E( X )
2 2

O desvio-padrão, conseqüentemente é encontrado extraindo-se a raiz quadrada positiva da


variância:

DP( X )  Var( X )
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 28

Exemplo - Prova

Encontrar a variância e o desvio-padrão para o número de acertos na prova.

Exemplo – Dados

Criar a variável X=soma das faces no lançamento de dois dados e construir a sua função de
probabilidade.

Exercício completo – Para a função de probabilidade a segui, encontre o valor de k, construa


a distribuição acumulada, encontre a Esperança e a Variância de X.

x 0 1 2 3 4
P(X=x) 0,35 0,30 0,20 k 0,05

3.7 Principais modelos discretos

A partir de agora veremos modelo (fórmulas, expressões) que retratam o comportamento


probabilístico de variáveis discretas. Veremos apenas dois: Binomial e Poisson.

3.7.1 Distribuição Binomial

Um caso como o da prova de quatro questões pode ser resolvido pela Distribuição Binomial.
Sempre que um experimento que assume apenas dois possíveis resultados em cada repetição
for repetido n vezes e que a probabilidade de sucesso for constante em cada repetição,
podemos modelar o número de sucessos pela distribuição Binomial.

X = número de sucessos, variando de 1 até n


p = probabilidade de sucesso em cada repetição
1-p = probabilidade de fracasso em cada repetição
n = número de repetições

X ~ Binomial (n ; p)

x=0,1,...,n

n!
P( X  x)   p x  (1  p) n x
x!n  x !
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 29

Exemplo – Prova

No exemplo da prova, encontre os parâmetros da Binomial e calcule P(X=2).

Exemplo – Peças defeituosas

Numa fábrica peças são produzidas em larga escala (podemos considerar produção infinita).
Sabe-se que 5% das peças são defeituosas (D) e o restante perfeitas (P).

a) Qual a probabilidade de obtermos 2 peças defeituosas?

Exemplo – Loteria Esportiva

Numa loteria com 13 jogos de futebol, qual a probabilidade de um “desentendido de futebol”


acertar 11 ou mais jogos?

Esperança e Variância na Binomial

O número esperado ou esperança de sucessos na distribuição Binomial é facilmente


encontrado. Intuitivamente, responda as perguntas a seguir:

1) Se lançarmos uma moeda honesta 100 vezes, qual o número esperado de caras?

2) Se lançarmos um dado 600 vezes, qual o número esperado de faces “5”.

3) No exemplo da prole de 6 filhos, qual o número esperado de meninos?

n n
E(X) =  P( X  x )  C
x 0 x 0
x
n p x ( 1  p )n x = np

Var(X) = np(1-p)

Exemplos – Nos exemplos anteriores encontre a esperança

Prova: E(X)
Var(X)

Peças: E(X)
Var(X)

Loteria: E(X)
Var(X)
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 30

3.7.2 A distribuição de Poisson

A distribuição de Poisson é conhecida com a distribuição de um só parâmetro. Uma variável


aleatória discreta X segue uma distribuição de Poisson se a sua função de probabilidade é dada
por:

X ~ Poisson ()

e  x
P X  x   , x = 0,1,2,... >0
x!

Geralmente X representa o número de ocorrências num determinado espaço de tempo e o


parâmetro  é a média de ocorrências neste intervalo. Conhecidamente, o número de
chamadas telefônicas recebidas numa central, a chegada de navios a um porto, pode ser
modelada pela distribuição de Poisson.

Atenção: o parâmetro  deve estar em sintonia com a variável X.

Provando que P(X=x) é função de probabilidade:


e  x

x 0 x!
=1

Esperança e Variância na Poisson

 
e  x
E(X) =  xP( X  x )  x
x 0 x 0 x!


Var(X) = 

Exemplo – Navios

A taxa de chegadas de navios a uma porto segue a média de 1 por dia e pode ser modelada
pela distribuição de Poisson.

a) Qual a probabilidade de chegarem três navios em um mesmo dia?

b) Qual a probabilidade de chegar ao menos um navio em três dias?

c) Qual o número esperado de navios em uma semana?

Exemplo – Erros em um livro

Um revisor aponta que encontrou 100 erros em um livro de 200 páginas. Considere X=número
de erros por página, podendo ser modelada pela distribuição de Poisson.
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 31

a) Qual a probabilidade de encontrar, em uma página escolhida ao acaso, dois erros?

b) Qual a probabilidade de encontrar, em uma página escolhida ao acaso, ao menos um erro?

Aproximação entre Binomial e Poisson

A medida que ninfinito e p0 a distribuição Binomial pode ser aproximada pela Poisson.

 n e  np np 
x
P( X  x )    p x ( 1  p )n x 
n  p 0
 x x!

Para np  7 já temos uma boa aproximação.

Exemplo – X ~ Binomial (n=30 ; p=1/20)

Comparar a probabilidade P(X=0) e P(X=1) pela Binomial e Poisson.

Binomial Poisson
0,4000 0,4000
0,3500 0,3500
0,3000 0,3000
0,2500 0,2500
0,2000 0,2000
0,1500 0,1500
0,1000 0,1000
0,0500 0,0500
- -
0 3 6 9 12 15 18 21 24 27 30 0 3 6 9 12 15 18 21 24 27 30
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 32

3.8 Variáveis aleatórias contínuas

3.8.1 Definições Básicas

As variáveis contínuas podem, ao menos teoricamente, assumir qualquer valor num intervalo
numérico. Sendo assim fica impossível representarmos variáveis contínuas da mesma forma
que as variáveis discretas. Diferenciando um caso discreto de um contínuo:

Caso discreto Caso contínuo


0,30
P(X=x)

P(X=x)
0,25 0,30

0,20 0,25
0,20
0,15
0,15
0,10
0,10
0,05 0,05
- -
0 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 13

Importante

As variáveis contínuas são representadas por curvas, chamadas de função densidade de


probabilidade, e a área sob essa função representa a probabilidade de ocorrência. Nas
variáveis contínuas não existe a probabilidade de ocorrência de um valor exato, mas sim de
intervalos.

A função densidade de probabilidade, denotada por fx(x), é a função que indica o


comportamento probabilístico da variável aleatória contínua X. A função densidade de
probabilidade deverá satisfazer as seguintes condições:

a) f(x)  0, para todo x  R.

b)  f ( x )dx  1
A área sob a curva fx(x) nos informa a probabilidade de ocorrência de valores da variável X.
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 33

Supondo que o gráfico acima represente a função de probabilidade de uma variável aleatória X.
Como sabermos a probabilidade de ocorrência de valores entre a e b ?

b
P( a  X  b )   f ( x )dx
a

A função de distribuição acumulada de X, denotada por F(x), indica a a probabilidade


acumulada até o valor x.

x
F ( x )  P( X  x )   f ( x )dx


Propriedades da F(x):

1o) F(x) é contínua e não decrescente

2o) F(-  )=0 F(  ) = 1

3o) P(a < X < b) = F(b) – F(a)

d
4o) f ( x )  F( x )
dx

Exercício – Fixação do conteúdo

Esboce graficamente a f(x). Verifique se f(x) é função densidade, encontre a F(x) e calcule
P(X<0,5).

2 x;0  x  1
f(x) 
0; c.c.

Exercício – Fixação do conteúdo II

Esboce graficamente a f(x). Verifique se f(x) é função densidade, encontre a F(x) e calcule a
P(1/4<X<3/4).

4 x ; 0  x  1/2

f ( x )  4 - 4x ; 1/2  x  1
0
 ; caso contrário

Esperança e Variância de uma variável aleatória contínua

O cálculo da esperança e da variância no caso contínuo pode ser feito de forma análoga ao
caso discreto. Agora o  será substituído pela : 
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 34

E( X )   xf ( x )dx

Var( X )  E( X 2 )  E( X ) onde E( X 2 )   x 2 f ( x )dx


2

Em geral:

E( g( x ))   g( x ) f ( x )dx

Exemplo – Encontrar E(X) e Var(X) nos exercícios de fixação I e II

3.9 - Principais Modelos Contínuos

Existe uma gama de modelos contínuos bastante utilizados. Eles já se encontram descritos na
literatura e suas principais características são conhecidas.

3.9.1 Distribuição Uniforme ou Retangular

Uma v.a.c X tem distribuição Uniforme se a sua função densidade f(x) descreve um retângulo
que dá sempre a mesma probabilidade de ocorrência para intervalos de mesmo tamanho.

X ~ Uniforme [a , b]
a xb

 1
 ; axb
f ( x)   b  a

 0 ; caso contrário

f(x)

1/(b-a)

a b
x
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 35

xa
Provar que F ( x)  para a  x  b .
ba

Esperança e Variância na Uniforme

ba (b  a) 2
E( X )  Var ( X ) 
2 12

Exemplo - Tempo de produção (Distribuição Uniforme)

O tempo para produzir uma peça é igualmente provável de estar entre 60s e 70s.

a) Esboce graficamente a função densidade de probabilidade para X = tempo (s).

b) Calcular a probabilidade do tempo na exceder 66s.

Exemplo - O gerador de números pseudo-aleatórios do EXCEL

O gerador de números pseudo-aleatórios do Excel deveria seguir uma Uniforme [0;1].

a) Calcule a esperança e a variância de X e a probabilidade P(X>0,7).

b) Realize uma simulação com 1000 números no Excel e verifique se os resultados coincidem.
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 36

3.9.2 Distribuição Exponencial

A distribuição Exponencial pode ser utilizada na modelagem do tempo entre ocorrência de


acidentes, tempo de ocorrência entre chamadas telefônicas. Na distribuição Exponencial
consideramos que a probabilidade de ocorrência de um evento é constante em intervalos de
amplitude .

Uma v.a.c. X tem distribuição Exponencial se a sua função densidade de probabilidade é dada
por:

X ~ Exponencial ()

e  x ; x  0
f ( x)    0
0 ; c.c.

Vejamos a forma da função densidade f(x) para diferentes valores de :

1,8

1,6 Lambda=0,5
Lambda=1
1,4
Lambda=2
1,2

0,8

0,6

0,4

0,2

0
0 1 2 3 4 5 6

Provando que f(x) é função densidade:

 e
 x
dx  1
0

Função de distribuição acumulada F(x):

 e
 x
dx  1  e x
0
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 37

Esperança e Variância na Exponencial

Relembrando Integral por partes:

 vu'  vu   uv' neste caso, escolher u'  e x


1
E ( X )   xf ( x)dx   xe x dx 
0

1
Var ( X ) 
2

Exemplo – O período de quebra entre componentes eletrônicos segue uma distribuição


Exponencial com média de 2 anos.

a) Qual a probabilidade de que haja uma quebra dentro de 4 anos?

b) Qual a probabilidade de que haja uma quebra entre 2 e 4 anos?

Exemplo – O tempo entre chamadas telefônicas segue uma distribuição Exponencial com
média de 15 minutos.

a) Qual a probabilidade de que chegue uma chamada dentro de 20 minutos?

b) Sabendo que já se passaram 20 minutos, qual a probabilidade de que chegue uma ligação
antes dos 40 minutos?

A letra b) do exercício anterior nos leva a perceber uma importante característica da


distribuição exponencial: a falta de memória (memorylessness).

P( X  s  t | X  t )  P( X  s)

No exemplo:
P( X  20  20 | X  20)  P( X  20)
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 38

3.9.3 Distribuição Normal, Gaussiana ou Curva de Gauss

A distribuição normal ou curva de Gauss é, sem dúvida, o principal modelo probabilístico


contínuo, pois serve de base para a principal área da Estatística: a Estatística Inferencial.

Uma v.a.c. X tem distribuição normal com parâmetros  e  se sua função densidade de
probabilidade é dada por:

( x )2

f x  
1
e 2 2
, x  ,
 2
onde  e  são parâmetros,
-  <  < + ;   0

Notação

X  N(,)

X tem distribuição Normal com média  e desvio-padrão .

Os parâmetros da Normal são a média e o desvio-padrão, que permitem infinitas curvas


normais com diferentes formatos (mas sempre simétricas). O gráfico da fX é apresentado a
seguir:

Características da Normal

  f ( x )dx  1
 E( X )   xf ( x )dx  
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 39

x f ( x )dx   2  
2
 DP(X) =

Outra característica importante da Normal é que, independentemente dos valores dos


parâmetros, a seguinte relação é sempre válida:

Entendendo os parâmetros da curva Normal:

 (média) é uma parâmetro de locação

 (desvio-padrão) é um parâmetro de forma

Vejamos exemplos:
f(x)

f(x)

f(x)

-10 -5 0 5 10 -10 0 10 -10 -5 0 5 10


Valores de X Valores de X Valores de X

Exemplo – Altura
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 40

Coletar a altura dos alunos em sala de aula e realizar alguns cálculos.

Os cálculos integrais envolvendo a distribuição Normal são bastante complicados. Felizmente,


veremos a seguir uma relação que facilita muito nossa vida.

Distribuição Normal-padrão ou Normal reduzida

Seja X uma variável aleatória normalmente distribuída com quaisquer parâmetros média  e
desvio-padrão . Se realizarmos a seguinte transformação obteremos uma nova variável Z com
média 0 e desvio-padrão 1:

X 
X  N(,)  Z  Z (0,1)

Qualquer variável com distribuição Normal pode ser padronizada para a Normal. A
distribuição Normal padronizada (Z) é tabelada.

Exemplo – Aprendendo a usar a tabela

1) Calcule:
a) P(Z  1,64) d) P(Z  0)
b) P(Z  0,38) e) P(-1,96  Z  1,96)
c) P(2,57  Z  2,57)

2) O peso de sacos de arroz com valor nominal de 1kg segue uma distribuição
aproximadamente Normal com média de 1010g com desvio-padrão de 20g.
a) Qual a probabilidade de um saco ter peso inferior a 1040g?
b) Qual a probabilidade de um saco ter peso superior a 1050g?
c) Qual a probabilidade de um saco ter menos de 1kg?
d) Qual a probabilidade do peso estar entre 990g e 1030g?
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 41

Cap. 4. - Amostragem

4.1 Conceitos Básicos

Amostragem é o nome dado ao conjunto de procedimentos e técnicas para extração


de elementos da população para compor a amostra. O objetivo da amostragem é obter
amostras representativas das populações em estudo. Um Censo seria a investigação da
população completa.

Por que trabalhar por amostragem?

________________________________________

________________________________________

________________________________________

________________________________________

A fração de amostragem é a razão entre o tamanho amostral e o tamanho


populacional. Não existem regras fixas para tamanho de amostra, ou seja cada caso
merece um cuidado especial. Frases como “20% da população é ideal”, quase sempre
não são verdadeiras.

As técnicas de amostragem se dividem em: probabilísticas e não-probabilísticas.


As técnicas probabilísticas são aquelas onde todos elementos da população têm uma
probabilidade não nula de seleção. Nas técnicas não-probabilísticas não podemos
garantir que todos elementos têm probabilidade de serem selecionados para a amostra.

4.2 Principais técnicas de amostragem probabilística

Geralmente as técnicas probabilísticas produzem melhores resultados do que as não


probabilísticas. A seleção dos elementos envolve obrigatoriamente a utilização de algum
dispositivo aleatório para seleção das unidades amostrais.

Exemplo de dispositivos aleatórios:


Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 42

4.2.1 Amostragem Aleatória Simples (AAS)

Apesar de ser uma forma extremamente simples de seleção de elementos da


população, é considerada uma das melhores técnicas de amostragem.

Na AAS cada elemento da população tem igual probabilidade de seleção e o


pesquisador não introduz nenhum vício no processo.

Etapas:

1) Enumerar a população de 1 até N.


2) Sortear n números no intervalo de 1 até N. Caso haja números repetidos, sortear
novamente mais alguns valores.

Probabilidade de seleção de um elemento na AAS:

Número de amostras possíveis SEM reposição:

Número de amostras possíveis COM reposição:

Exemplo 23 – Amostra n=2 da população N=5

Verificar quantas amostras são possíveis COM e SEM reposição da população de


tamanho 5 verificando também as probabilidades de seleção de cada unidade.

A B C D E
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 43

4.2.2 Amostragem Estratificada

Na Amostragem estratificada a população é dividida em subpopulações ou estratos de


forma que N1 + N2 + ... + NK = N.

Um tamanho amostral n é repartido proporcionalmente entre os estratos, respeitando


as frações Ni / N. Depois de estabelecidos o valor de ni, procede-se uma seleção
aleatória dentro de cada estrato.

Exemplo 24 – Amostra estratificada na região sul

Dividir proporcionalmente uma amostra de 1300 pessoas em três estratos,


correspondentes aos três estados da região sul.

i Estado Pop. % Amostra


1 Rio Grande do Sul 9.637.682
2 Santa Catarina 4.875.244
3 Paraná 9.003.804
Total 23.516.730

4.2.3 Amostragem Sistemática

A amostragem sistemática inicia com o cálculo do intervalo de amostragem f=N/n.


Depois, selecionamos um número entre 1 e f e vamos indo sistematicamente de f em f
elementos, até o final.

A amostragem sistemática é útil quando temos cadastros impressos que estão


ordenados segundo algum critério que nada tem a ver com os interesses da pesquisa.

Exemplo 25 – Escolhendo 8 alunos de um total de 40

Planta da sala de aula


1 11 21 31
2 12 22 32
3 13 23 33
4 14 24 34
5 15 25 35
6 16 26 36
7 17 27 37
8 18 28 38
9 19 29 39
10 20 30 40
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 44

Cap. 5. - Distribuições Amostrais e Estimação

5.1 – Parâmetros e Estimadores

O que é inferência estatística?

Inferir consiste na retirada de informações para TODA população baseando-se numa


amostra da mesma. Chamamos de parâmetros as quantidades populacionais e de
estimadores as funções de dados amostrais que irão gerar as estimativas para os
parâmetros populacionais.

Tabela - Exemplos de parâmetros e seus respectivos estimadores


Parâmetros Estimadores

Média populacional Média amostral


 X
Desvio-padrão populacional Desvio-padrão amostral
 s
Proporção populacional Proporção amostral
p p̂

Há dois tipos de estimação de parâmetros: a estimação por ponto e por intervalo.


Também existe uma outra forma de inferência estatística muito utilizada em situações
práticas: os testes de hipóteses.

5.2 Distribuição Amostral da Média

A base da estatística inferencial é o TEOREMA DO LIMITE CENTRAL.

O teorema diz que se extrairmos TODAS as possíveis amostras de tamanho n de uma


população de tamanho N a distribuição das médias amostrais X tende a se distribuir
como uma curva Normal com média igual ao parâmetro  e desvio-padrão  n .

Exemplo – População de tamanho N = 6

Considere a seguinte população de cinco elementos e X = Idade (anos)

20 30 40 50 60 70
A B C D E F

a) Quais são os parâmetros populacionais?


b) Quantas amostras diferentes de tamanho n=2 podemos extrair da população?
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 45

Exemplo – Selecionando uma amostra na sala de aula

Suponha que seja necessário selecionar uma amostra de n=5 alunos da turma para
representar a nossa turma numa reunião na reitoria. Qual o número de amostras
possíveis de serem selecionadas?

Exemplo – População com média 0,5

Considere uma população infinitamente grande com média   0,5 . Vamos avaliar as
distribuições amostrais da média amostral X com n = 30 e 300.

2,0 3,5
3,0
1,5 2,5
2,0
1,0
1,5

0,5 1,0
0,5
- -
0 0,2 0,4 0,6 0,8 1 0 0,2 0,4 0,6 0,8 1
Médias amostrais Médias amostrais

n = 30 n = 300

Percebemos claramente que com o aumento do tamanho amostral a distribuição de X


fica cada vez mais concentrada em torno do parâmetro . Isso quer dizer que, quanto
maior amostra maior a possibilidade de acerto.

RESULTADO


X tem distribuição Normal com Média =  e Desvio-padrão =
n
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 46

5.3 – Estimação por ponto

Visa estimar o valor do parâmetro através de estimativas pontuais (únicas). A vantagem


é ser de fácil interpretação e rápida, mas a probabilidade de acerto “na mosca” é
praticamente nula, pois os estimadores podem ser encarados como variáveis aleatórias
contínuas.

Exemplo – World Trade Center

Um mês após o ataque ao WTC de NY perguntamos a 1000 americanos, escolhidos de


maneira aleatória, se estão com medo de viajar em vôos domésticos em território
americano.

Se 852 pessoas da amostra afirmam estar com medo, podemos estimar que 85,2% dos
americanos estão com medo de viajar de avião após os ataques terroristas de
11/Set/2001.

5.4 – Estimação por intervalo de confiança

Consiste em cercar o valor da estimativa pontual por uma região cuja probabilidade de
conter o verdadeiro parâmetro seja conhecida.

NOTAÇÕES que serão utilizadas a partir de agora

 (alfa) = nível de significância 1 -  = nível de confiança


t  = valor da distribuição t de Student com n-1 graus de liberdade e área à
n 1; 2
2
direita.


z  = valor da distribuição normal padrão com área à direita.
2
2

1o ) Intervalo de Confiança para  (teórico)

Conhecendo o teorema do limite central podemos construir intervalos de confiança para


a média populacional. Para isso basta cercarmos a estimativa pontual X por um
intervalo cuja probabilidade de conter o parâmetro seja conhecida.

  N n
I.C. para  com 1- de confiança =  X  z    
 2 n N  1 
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 47

Na fórmula de IC acima percebemos a presença de um parâmetro (). Se estamos


procurando um intervalo de confiança para  é porque NÃO conhecemos . É
praticamente impossível conhecermos  e não conhecermos . Por isso esse resultado
acaba sendo INÚTIL na prática.

2o ) Intervalo de Confiança para  (prático)

Ao substituirmos o parâmetro  por seu estimador s , a distribuição amostral de X


deixa de ter uma distribuição Normal e passa a ter uma distribuição t de Student. Desta
forma os Intervalos de confiança podem ser utilizados em situações práticas.

 s N n
I.C. para  com 1- de confiança =  X  t    
 n 1,
2 n N  1 

N n
Obs: O fator de correção é omitido em caso de populações infinitas. O EXCEL
N 1
simplesmente ignora esse fator de correção.

Exemplo:

Numa amostra de 121 ligações, o tempo médio foi de

Construir um IC 95% para o verdadeiro tempo médio de uma ligação.

 s 
I.C. 95% para  =  X  t   
n 1,
 2 n
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 48

O EXCEL constrói Intervalos de Confiança sem o fator de correção com o comando


Estatísticas Descritivas que fica dentro da opção “Análise de Dados” no Menu
“Ferramentas”. Para incluir essa opção deve-se ir até “Suplementos” e assinalar a
opção “Ferramentas de Análise”.

ATENÇÃO: é necessário ter o banco de dados digitado em EXCEL para fazer


isso.

Figura – Tela do Excel: Ferramentas > Análise de dados > Estatística Descritiva

Tabela - Saída do EXCEL:


Tempo
Média 13,041
Erro padrão 0,264
Mediana 13
Modo 13
Desvio padrão 2,908
Variância da amostra 8,457
Curtose -1,209
Assimetria 0,041
Intervalo 10
Mínimo 8
Máximo 18
Soma 1578
Contagem 121
Nível de confiança(95,0%) 0,523
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 49

3o) Intervalo de Confiança para uma proporção populacional p

A estimativa pontual para uma proporção é dada diretamente pela proporção amostral.
É muito útil construirmos um intervalo em torno da estimativa pontual que possua uma
probabilidade conhecida de conter a verdadeira proporção populacional.

 pˆ  (1  pˆ ) N n
I.C. para p com 1- de confiança =  p  z    
 2
n N  1 

onde z 0,05 =1,645 (90%)


z 0,025  1,96 (95%)
z 0,005  2,576 (99%)

N n
Obs: O fator de correção é omitido em caso de populações infinitas.
N 1

O EXCEL NÃO faz intervalos de confiança para proporções.

Exemplo – Proporção de canhotos da PUCRS

Numa amostra de n=_______ alunos de uma população de N=30.000 de toda PUCRS,


verificamos que _______ são canhotos.

a) Qual a estimativa pontual de canhotos?

b) Construa intervalos de confiança 95% e 99% para a proporção de canhotos. Agora


use o fator de correção.
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 50

Cap. 6 Testes de Hipóteses


Os testes de hipótese constituem outra forma de inferência estatística. Hipóteses são
afirmações sobre parâmetros populacionais. Agora iremos testar se essas
hipóteses podem ser consideradas verdadeiras ou não. Os testes de hipótese são
muito objetivos, pois o resultado final é a ACEITAÇÃO ou REJEIÇÃO da hipótese
formulada.

Etapas de um teste de hipóteses:


1.Formular as hipóteses
2.Definir qual o nível de significância será utilizado (alfa)
3.Verificar qual o teste adequado e calcular a estatística de teste
4.Decidir pela aceitação ou rejeição da hipótese de nulidade com base no p-value.
5.Conclusão experimental

A hipótese nula (Ho) é a hipótese sob a qual a teste é realizado. Essa hipótese será
ACEITA ou REJEITADA. Se os dados amostrais estiverem de acordo com a hipótese
nula formulada, a estatística de teste nos levará a uma aceitação. Por outro lado, se os
dados amostrais não estiverem em sintonia com a hipótese formulada, o teste nos
levará a uma rejeição da hipótese nula.

A hipótese alternativa (H1 ou Ha) é uma hipótese complementar a Ho. Por isso se
rejeitamos Ho, conseqüentemente aceitamos H1.

O nível de significância do teste () é definido pelo pesquisador. Ele significa a


probabilidade de cometermos erro tipo I, ou seja, rejeitarmos Ho sendo a mesma
verdadeira.

A decisão estatística é a REJEIÇÃO ou ACEITAÇÃO de Ho. Essa decisão está sujeita


aos seguintes erros:

Tabela – Tipos de Erros


Realidade
Decisão Ho Verdadeira Ho Falsa
Aceito Ho OK Erro tipo II

Rejeito Ho Erro tipo I OK

O erro do tipo I ou nível de significância () é controlado pelo pesquisador. O erro do


tipo II () é geralmente esquecido. Por esse motivo vamos sempre preferir uma
REJEIÇÃO do que uma ACEITAÇÃO. No caso de uma REJEIÇÃO ou tomamos a decisão
correta ou cometemos o erro com probabilidade . Os valores de  mais utilizados são
5%, 1% e eventualmente 10%.
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 51

A conclusão experimental consiste em explicar com palavras simples o resultado de


um teste de hipóteses.

Os testes que iremos estudar são os mais famosos e encontrados em praticamente


todos os livros de Estatística.

• Teste t de Student para uma média


• Teste t de Student para comparação de duas médias (amostras independentes)
• Teste t de Student para comparação de duas médias (amostras emparelhadas)
• Teste Qui-Quadrado (para variáveis organizadas na forma de uma tabela cruzada)

6.1 - Teste t de Student para uma média

É uma técnica que permite testarmos a hipótese de que a média populacional pode ser
considerada igual a um valor de referência, digamos o.

Apresentação das hipóteses:


Ho :    o Ho :    o Ho :    o
  
Ha :    o Ha :    o Ha :    o


Iremos estudar apenas os testes bilaterais, ou seja, onde as hipóteses não são
direcionadas para um único sentido. As regiões de rejeição ficam nos dois lados da
curva.

A estatística de teste é dada por:

x - o
t
s/ n

Apesar de ser um procedimento simples, o EXCEL não realiza esse tipo de teste. Já, o
programa estatístico SPSS, por exemplo, faz.

As regiões de rejeição e aceitação do teste t são estabelecidas pelos valores de t,


conforme mostra o desenho a seguir de uma curva t com n-1 graus de liberade.
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 52

Os valores de t são encontrados na tabela t entregue em sala de aula. Comparando o


valor da estatística de teste t calculado com os valores de t obtidos na tabela chegamos
a decisão estatística e podemos enunciar a conclusão experimental.

Apesar do EXCEL não fazer isso podemos utiliza-lo para calcular a média amostral e o
desvio-padrão.

Exercício (52 da lista):

Uma agência bancária afirma que o tempo médio de espera na fila é de 15 minutos.
Entretanto, os clientes estão revoltados com a demora no atendimento e dizem que a
afirmação não é verdadeira, ou seja, o tempo de espera é superior a 15 min. Para
poder argumentar contra o banco, os clientes realizam uma amostra com 200 pessoas,
anotando o tempo até o atendimento.

a) O resultado foi um tempo médio de espera de 19 min e variância de 49 min 2. Ao n.s.


de 5%, quem tem razão?.

Sobre o p-value
O p-value, valor de p ou significância da estatística é o valor informado na saída
dos softwares estatísticos. Esse número é, portanto, uma probabilidade que deve ser
comparada ao nível de significância adotado.

Se p-value > nível de significância adotado, então ACEITAMOS Ho.


Se p-value < nível de significância adotado, então REJEITAMOS Ho.
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 53

6.2 Teste t de Student - duas amostras independentes

É uma técnica estatística que permite testarmos a hipótese de que duas médias
populacionais são idênticas. É extremamente utilizada para comparação de dois grupos
independentes.

Apresentação das hipóteses (caso bilateral):

Ho : 1   2

Ha : 1   2

A estatística de teste tem uma forma um tanto “amigável”:

t
x1 - x2 
s12  (n1 - 1)  s22  (n2  1)  1 1 
   
n1  n2  2   n1 n 2 

que deve ser comparado com uma distribuição t de Student com (n1+n2-2) graus de
liberdade

As regiões de rejeição e aceitação seguem a mesma lógica do teste anterior.

No EXCEL: Ferramentas  Análise de Dados  Teste t: duas amostras presumindo


variâncias equivalentes

ATENÇÃO: Esse teste só pode ser utilizado se a variância (ou desvios-padrão) das
duas populações em questão não forem muito diferentes.

Exercício:

Solos brasileiros são deficientes em fósforo. Numa comparação entre amostras de solo
da serra gaúcha e do Valle Central do Chile, os resultados encontrados (mg/kg) foram:

Resultados (xi) Média Desvio


G1-Serra Gaúcha 0,6 1 0,7 1,2 1,1 1,4 1,1 1 0,9 1,00 0,24
G2-Valle Central 1,2 1,4 1,5 1,6 1,2 1,7 1,5 1,2 1,3 1,40 0,19

a) Realizar um teste t de Student para comparação entre RS e Chile ao nível de 5%.


Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 54

Exemplo – Tela e saída do EXCEL para o exemplo da Ansiedade

Teste-t: duas amostras presumindo variâncias equivalentes


Variável 1 Variável 2
Média 1,00 1,40
Variância 0,06 0,04
Observações 9,00 9,00
Variância agrupada 0,05
Hipótese da diferença de média -
gl 16,00
Stat t -3,89
P(T<=t) uni-caudal 0,001
t crítico uni-caudal 1,75
P(T<=t) bi-caudal 0,001
t crítico bi-caudal 2,12
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 55

6.3 Análise de Variância (ANOVA)

A Análise de Variância (ANOVA, Analysis of Variance) pode ser encarada como uma
extensão do teste t de Student para comparação de três ou mais médias a partir de
amostras independentes.

As hipóteses da ANOVA são:

Ho : 1   2  ...   p


Ha : i   j para algum i  j

A lógica da ANOVA está na decomposição da variância total da variável resposta em


duas partes: uma relacionada aos tratamentos ou grupos (entre tratamentos ou
grupos) e outra relacionada ao erro experimental (dentro dos tratamentos ou grupos).

Em ANOVA, a variância é expressada em termos das Somas de Quadrados, e é através


delas que chegaremos a uma estatística de teste para aceitar ou rejeitar a hipótese
nula. O exemplo a seguir é de um Delineamento Completamente Casualizado (DCC), o
modelo mais simples de ANOVA, mas que é muito utilizado.

Exemplo
Suponha que um grupo de 12 alunos com características muito semelhantes foi dividido
em três grupos por meio de um sorteio. Esses grupos de alunos foram encaminhados à
três escolas de inglês para um curso intensivo. Após o curso, todos os alunos foram
submetidos a uma mesma avaliação. O escore final variava de 0 (pior possível) a 100
(melhor possível). Utilizar n.s de 5%.

Escolas Notas Médias


A 627 530 780 807 686
B 771 620 560 809 690
C 852 795 901 935 870,75
748,91
Média
Geral
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 56

- Decomposição da variabilidade e cálculos

Para decompor a variabilidade total, é mais fácil apresentar os dados conforme a tabela
a seguir:

Escolas Notas Médias


A 627 530 780 807 686,00
B 771 620 560 809 690,00
C 852 795 901 935 870,75
748,91
Média
Geral

3 4
SQtotal  SQdentro  SQentre   ( yij  y ) 2  (627-748,91)2 + ... + (935-748,91)2 =
i 1 j 1
= 194.040,9167

3 2

SQentre   ni  y i  y   4  686  748,91  4  690  748,91  4  870,75  748,91 


2 2 2

i 1

 89.092,17

SQdentro    yij  yi  SQtotal  SQentre  194.040,9167  89.092,17  104.948,7467


3 4
2

i 1 j 1

Perceba que se houver grande variabilidade dentro de um mesmo grupo, a SQdentro vai resultar um
valor grande. Por outro lado, se houver grande diferença nas médias dos grupos, a SQentre vai resultar
grande.

Passaremos agora a outras definições importantes. A primeira refere-se aos graus de liberdade. Os graus
de liberdade "entre tratamentos" serão iguais ao número de tratamentos menos um. Os graus de
liberdade "dentro dos tratamentos" serão iguais ao número de observações menos o número de
tratamentos.

GLentre  t  1
GLdentro  n  t
GLtotal  n  1

onde, 'n' é o número total de observações e 't' o número de grupos (tratamentos).

A última definição antes do teste será a de quadrado médio. Quadrado médio é o quociente entre as
Somas de Quadrados e os respectivos graus de liberdade:

SQentre SQdentro
QM entre  QM dentro 
GLentre GLdentro

O teste estatístico será baseado no quociente entre o QMentre e o QMdentro dos grupos. Esse valor terá
uma distribuição F de Snedecor que deverá ser comparada com as tabelas disponíveis.
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 57

Uma tabela de Análise de Variância Clássica tem, portanto, o seguinte formato no caso univariado:

CAUSAS DE VARIAÇÃO GL SQ QM F
TRATAMENTOS t-1 SQentre QMentre QMentre/ QMdentro
(entre tratamentos)

ERRO EXPERIMENTAL n-t SQdentro QMdentro


(dentro dos tratamentos)

TOTAL n-1 SQtotal

Vamos agora realizar uma ANOVA nesses dados:

1. Formulação das hipóteses


Ho: A média dos alunos na avaliação não varia entre as escolas
H1: Existe pelo menos duas escolas que diferem quanto a média da avaliação

2. Nível de Significância e Identificação dos fator e seus níveis


5%
Variável resposta: Nota dos alunos.
Tratamentos ou grupos: Escolas de inglês.

3. Cálculo da SQ, QM e estatística F


Vamos apresentar, então a tabela de ANOVA ao nosso exemplo:

CAUSAS DE VARIAÇÃO GL SQ QM F
ESCOLAS 2 89092,17 44546,09 3,82
(entre Escolas)

ERRO EXPERIMENTAL 9 104948,75 11660,97 -


(dentro das Escolas)

TOTAL 11 194040,9167

4. Definição da Área de Rejeição

5. Decisão e Conclusão Experimental

Se utilizarmos um nível de significância de 5% (0,05) para o teste estatístico F devemos aceitar a


hipótese nula de que a média dos alunos na avaliação não varia entre as escolas. Chegaremos a
conclusão de que não deve haver diferença entre o rendimentos dos alunos de acordo com a escola onde
estudam.

ANOVA no EXCEL
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 58

Exercício – Realizar uma ANOVA para comparação dos diâmetros dos parafusos nos três diferentes turnos
Manhã Tarde Noite
5,5 5,5 5,4
5,6 5,4 5,7
5,7 5,3 5,8
5,8 5,2 5,6
5,5 5,4 5,6
5,6 5,3
5,4
5,5
Médias 5,617 5,375 5,620

SQ total = 0,505263
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 59

Exemplo 2 – Eficiência de 3 antivirus

A B C
90 85 91
95 82 95
86 83 94
88 87 92
90 89 95
91 90 97
Média 90 86 94
Desvio 3,03 3,22 2,19

a) Realizando uma Análise de Variância


Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 60

Tela do EXCEL – ANOVA

Resultado da ANOVA no EXCEL


Anova: fator único

RESUMO
Grupo Contagem Soma Média Variância
A 6 540 90 9,2
B 6 516 86 10,4
C 6 564 94 4,8

ANOVA
Fonte da variação SQ gl MQ F valor-P F crítico
Entre grupos 192 2 96 11,80328 0,000833 3,68232
Dentro dos grupos 122 15 8,133333

Total 314 17

Atenção: A ANOVA não pode ser utilizada para comparar médias de


grupos onde a variância é muito diferente.

Existem testes de complementação para sabermos quais grupos diferem


entre si. Os mais famosos são Tukey, Duncan e Scheffé.
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 61

6.4 Teste do Qui-quadrado (2)

O teste do qui-quadrado é uma importante prova para verificar associação entre


duas variáveis qualitativas (categóricas). A técnica verifica se há ou não associação
entre as variáveis linha e coluna de uma tabela cruzada.

Hipóteses do teste:

Ho: As variáveis linha e coluna da tabela são INDEPENDENTES.


Ha: Existe uma relação de dependência entre as variáveis linha e coluna da tabela

Para exemplificar o cálculo das estatística de teste nada melhor do que um


exemplo. A estatística de teste Qui-quadrado baseia-se na diferença entre os
valores observados e esperados em cada célula da tabela cruzada. Os valores
esperados são calculados sob a hipótese de independência.

Obs.  Esp.2
Estatística de teste:  (2l 1)(c 1)   Esp.
que deve ser comparado com o

valor tabelado da qui-quadrado com (l-1)(c-1) graus de liberdade.

Exemplo – Máquina e Conformidade

Investigar se a probabilidade de uma peça ser conforme ou não-conforme depende


ou independe da máquina.

Conformidade
Máquina Não Sim Total
A 13 450 463

B 17 650 667

Total 30 1100 1130

O EXCEL não faz o teste qui-quadrado. O SPSS e o MINITAB fazem.


Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 62

Cap. 7. CORRELAÇÃO E REGRESSÃO

7.1 COEFICIENTE DE CORRELAÇÃO DE PEARSON

Neste capítulo passaremos a trabalhar com duas variáveis quantitativas (X,Y) e procuraremos
estudar o relacionamento existente entre elas. Primeiramente começaremos com os coeficientes
de correlação de Pearson e de Spearman que traduzem a associação entre as variáveis na
forma de uma medida no intervalo [-1;+1]. Depois buscaremos encontrar modelos
representativos que apresentem a relação de dependência entre as variáveis quantitativas X e
Y.

O real entendimento dos coeficientes de correlação é impossível sem o entendimento da


COVARIÂNCIA. Vamos nos recordar da fórmula da variância (estimador s2):

 x  X   x  X x  X   x  X y Y 
n n n
2
i i i i i
2
s  i 1
 s XX  i 1
e, logo, s XY  i 1

n 1 n 1 n 1

Façamos um exemplo para melhor ilustração:

Tabela – Amostra de n=5 pares (X,Y) de tempo de uso e viscosidade


i Tempo de Viscosidade
uso (xi) (yi)
1 2 8
2 4 7
3 6 5
4 8 3
5 10 2

Gráfico de dispersão entre X e Y:

10
Y = viscosidade

9
8
7
6
5
4
3
2
1
0
0 2 4 6 8 10 12
X = tempo de uso
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 63

IMPORTANTE: O sinal da covariância define o tipo de relacionamento (direto ou +, inverso ou


-).

O coeficiente de correlação de Pearson é uma medida no intervalo [-1;+1] que indica o grau de
relacionamento linear entre duas variáveis quantitativas X e Y. Valores –1 indicam associação
inversa perfeita, enquanto que o valor +1 indica associação direta perfeita. O valor zero indica
ausência de correlação e sinaliza independência entre as variáveis.

s XY
rXY  , logo temos que  1  rXY  1
s X sY

O teste de hipóteses para verificar se o verdadeiro coeficiente de correlação  é nulo (ou não)
é, muitas vezes, mais importante do que o próprio valor do coeficiente:

r n 2
~ t n 2
1  r2

Tipos de correlação entre variáveis:


Correlação direta Correlação inversa Correlação nula

Correlação não-linear Correlação não-linear


(2)

No exemplo anterior calcule r e realize o teste de hipóteses para .


Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 64

No EXCEL:

Também é possível utilizar: Ferramentas > Análise de dados > Correlação

No SPSS:

Correlati ons

Tempo Viscosidade
Tempo Pears on Correlation 1 -, 992**
Sig. (2-t ailed) . ,001
N 5 5
Viscosidade Pears on Correlation -, 992** 1
Sig. (2-t ailed) ,001 .
N 5 5
**. Correlat ion is signif icant at the 0. 01 lev el (2-t ailed).

IMPORTANTE: note que o Excel não faz automaticamente o teste de hipóteses; o SPSS faz.

Exemplo 2 – Medida padrão-ouro e Medida alternativa

Vamos verificar a correlação existente entre as variáveis no arquivo exemplo a seguir:

Medida Medida
padrão-ouro alternativa
Indivíduo (X) (Y)
1 10 11
2 20 22
3 30 26
4 40 38
5 50 48
Média 30 29
Desvio 15,81 14,35

No EXCEL podemos utilizar o comando CORREL.


Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 65

Exemplo – Correlação usando o EXCEL


Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 66

7.2 – Regressão Linear Simples

Antes de iniciar este capítulo faremos um exemplo motivador.

Exemplo motivador:

Considere uma amostra de n=6 funcionários e seus respectivos limiares de audição (yi).
Suponha que você precisa escolher “um único número” para representar esta amostra de
funcionários de forma que seja o mais correto possível. Chamaremos o valor estimado de Yˆ .

Exemplo – Limiar de audição (em dB)

Funcioná Limiar de audição Estimativa Erro Erro ao quadrado


rio (Y ) ( Yˆ ) ( Y  Yˆ ) ( Y  Yˆ )2
1 36
2 39
3 44
4 38
5 42
6 41
Y  40

n
Qual deve ser o valor de Yˆ para minimizar ( y
i 1
i  ŷ )2 ???

A técnica de Regressão Linear Simples estabelece uma relação de dependência entre uma
variável dependente Y e uma única variável independente X, supondo que o relacionamento
seja da forma linear:

Y =  + X (clássica equação da reta, relacionamento matemático)

Os termos  e  são os parâmetros do modelo linear.


Agora suponha que tenhamos um conjunto de pontos real, onde a relação linear entre X e Y
não é perfeita. Neste caso, precisamos introduzir um termo que considere a presença do erro
ou resíduo.

Y =  + X +  (relacionamento estatístico, presença do erro)

Como escolheremos os melhores estimadores para  e  de forma a minimizar o erro? O


procedimento será demonstrado a seguir:
1o) Considere uma amostra de n pares de observação (xi,yi).
i xi yi
1 x1 y1
2 x2 y2
... ... ...
n xn yn
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 67

2o) Agora admita a seguinte estrutura do modelo sugerido, onde a e b são os estimadores de 
e .
yi  a  bxi  ei

3o) Agora admita que ŷi é uma estimativa do valor de yi para um dado xi e que ŷi  a  bxi .

4o) Encontraremos os estimadores a e b pelo método dos mínimos quadrados. O método dos
mínimos quadrado consiste em encontrar qual os valores dos estimadores a e b que tornam o
n

 e 
2
resultado de i mínimo.
i 1

n n n

 ei    yi  ŷi    yi  a  bxi 


2 2 2

i 1 i 1 i 1

 n
 a   yi  a  bxi   0
2

 i 1


n


 b i 1
 yi  a  bxi   0
2

Exemplo – Limiar de audição (em dB) e o Tempo de exposição ao ruído (anos)

Funcioná Limiar de Tempo de Estimativa Erro Erro ao


rio audição exposição ˆ
(Y ) ( Y  Yˆ ) quadrado
(Y ) (X) ( Y  Yˆ )2
1 36 2
2 39 7
3 44 10
4 38 6
5 42 9
6 41 8
Y  40 X 7

Encontrar a reta de regressão, utilizando as fórmulas previamente encontradas. Já foi calculado


o seguinte:

n n

y
n n

 xi2  334
n

 xi  42  yi  240 x y
2
i  9642 i i  1719
i 1 i 1 i 1 i 1 i 1

Figura – Gráfico de dispersão entre X e Y


Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 68

Y = limiar de audição (db) 45


43
41
39
37
35
33
31
29
27
25
0 2 4 6 8 10 12
X = tempo de exposição

Percebe-se que incorporando a informação do tempo de exposição, o somatório dos erros de


predição ao quadrado – a melhor medida para a habilidade preditiva do modelo – baixa de
____ para _____.

As fórmulas para as estimativas dos parâmetros, obtidas pelo MMQ, são as seguintes:

 XY   n
X Y
b  a  Y  bX
 X
X  
2
2

Interpretando as estimativas dos parâmetros  e :

 a estimativa “a”: o limiar de audição esperado para um funcionário que jamais se expôs
ao ruído (X=0) é de “a” dB.

 O coeficiente “b” indica que a cada aumento de um ano, espera-se um aumento de “b”
dB no limiar de audição dos funcionários.

É importante lembrar que as predições só podem ser feitas dentro do intervalo da variável
independente. Em nosso exemplo, essa equação de regressão só poderia ser utilizada em
predições para funcionários com tempo de exposição entre 2 e 10 anos ou na vizinhança
próxima. Se afastando deste intervalo podem haver absurdos.
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 69

Suposições em Análise de Regressão

Além de admitir que o modelo linear seja razoável para representar o relacionamento entre X e
Y, também temos que admitir que a variância de Y seja constante, independentemente do valor
de X.

A parte inferencial da análise de regressão exige algumas suposições extras:

 ~ Normal(   0; e )

A medida mais utilizada para determinar a habilidade preditiva de um modelo de regressão


estimado é o coeficiente de determinação (r2). Esse coeficiente é uma medida da proporção da
variância da variável dependente que está sendo explicada pela variável independente. O
coeficiente varia entre 0 e 1, sendo que o valor 1 significa que a predição foi perfeita. Valores
muito pequenos de r2 indicarão que o modelo estimado é inútil. O coeficiente de determinação
(r2) é o quadrado do coeficiente de correlação de Pearson (r) entre X e Y.

O cálculo do r2 é feito da seguinte forma:


n
e2i
 Y2  
i 1 n
SQRe g
r2  
 2
Y SQTotal

É muito fácil percebermos pela fórmula que se não houver erro de predição o r2 será 1. No
exemplo, o r2 foi de ______%.

Podemos fazer mais inferências sobre o modelo ajustado. A saída completa de um software
estatístico para a técnica de regressão apresenta uma tabela de Análise de Variância, por meio
da qual testamos a hipótese de que a variável =0.

Causa de variação Graus Soma de Quadrado F Valor de p


de quadrados médio Significância
liberdade
Modelo de regressão 1 SQReg SQReg QMReg/QMErro
Erro ou resíduo n-2 SQErro SQErro / n-2
Total n-1 SQtotal

Também há testes específicos para  e . No caso da regressão simples, o teste de  equivale


ao teste F.

No EXCEL podemos utilizar dois comandos:

1o) Ferramentas  Análise de Dados  Regressão (Saída completa)

2o) Fazer um gráfico de dispersão entre X e Y, clicar com o botão direito sobre os pontos e
solicitar “Adicionar linha de tendência”, marcando as opções para mostrar o coeficiente de
determinação (r2) e a equação da reta.
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 70

RESUMO DOS RESULTADOS

Estatística de regressão
R múltiplo 0,952
R-Quadrado 0,905
R-quadrado ajustado 0,882
Erro padrão 0,997
Observações 6

ANOVA
gl SQ MQ F F de significação
Regressão 1 38,03 38,03 38,26 0,003
Resíduo 4 3,97 0,99
Total 5 42,00

CoeficientesErro padrão Stat t valor-P


Interseção 33,175 1,176 28,210 0,000
Tempo (X) 0,975 0,158 6,186 0,003

45
Y = limiar de audição

43
41
39
(db)

37
35
33 y = 0,975x + 33,175
31 R2 = 0,9054
29
27
25
0 2 4 6 8 10 12
X = tempo de exposição
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 71

Exercícios:

1) Para investigar o efeito da quilometragem de um automóvel sobre a viscosidade do óleo foi


realizado um estudo com 10 automóveis.
Quilometragem Viscosidade
(X) (Y)
10 9,0
15 9,1
20 8,0
25 8,5
40 6,5
45 7,2
50 7,1
60 7,5
70 6,0
80 5,4

Var(Y) =1,3921

10
8
Viscosidade

6
4 y = -0,0472x + 9,3908
2 R2 = 0,8263
-
0 20 40 60 80 100
Quilometragem (mil km)

a) Construa uma tabela de ANOVA para a regressão.


b) O óleo de um carro 0km deve apresentar qual viscosidade?
c) Em qual quilometragem o óleo deverá perder totalmente a viscosidade?

2) Uma máquina dispõe de uma regulagem que varia de –3 até +3 para controlar a espessura
de um filme plástico. Os dados coletados foram:

Regulagem Espessura
-3 4,5
-2 4,1
-1 4,0
0 3,9
1 4,3
2 4,2
3 4,7

a) A partir da regulagem é possível prever a espessura por meio de um modelo linear?


Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 72

7.3 – Regressão Linear Múltipla

Em regressão linear múltipla, admitimos que uma única variável dependente Y pode ser
explicada por um conjunto de variáveis independentes X1, X2, ..., Xp.

1o) Considere uma amostra de n observações.


i X1i … Xpi yi
1 x11 … xp1 y1
2 x12 … xp2 y2
... ... … ... ...
n x1n ... xpn yn

2o) Agora admita a seguinte estrutura do modelo sugerido, onde a e bj são os estimadores de 
e  j.
yi  a  b1x1i    bp x pi  ei

3o) Agora admita que ŷi é uma estimativa do valor de yi para um dado conjunto xi e
que yˆi  ai  b1x1i    bp x pi  ei .

Colocando na forma matricial, temos que:

 yˆ1  a  b1 x11    bp x p1  e1


 yˆ  a  b x    b x  e
 n 1 1n p pn n

Colocando na forma matricial:


a  1 X 11  X p1 
Y1  b   e1 
Y   1 1 X  X p 2  e 
Y   2 X  ε   2
12
B   b2 
n1  ( p 1)1
 n  ( p 1)      n 1 
       
Yn  1 X 1n  X pn  en 
bp 

Y  XB  ε
ˆ  XB
Y ˆ

Se minimizarmos a soma dos quadrados dos resíduos pelo MMQ, chegaremos a seguinte
solução:

ˆ  X`X 1 X`Y


B
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 73

Exemplo – Comprando um carro

Y = Preço Constante X1 = ano modelo X2 = mil km


50 1 2013 0
40 1 2012 15
38 1 2012 30
32 1 2011 55
30 1 2011 40

Rodando no Matlab a expressão:

beta=inv(X'*X)*X'*Y

beta =

-19098.126
9.5118
0.0094488

[X1,X2] = meshgrid(2010:1:2014, 0:10:60);


Z = -19098+9.51.*X1+0.0095.*X2;
figure(1)
surf(X1,X2,Z), colorbar

Estime o preço de um carro 2013 com 7 mil km.

No Excel: Análise de dados > Regressão


Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 74

RESUMO DOS RESULTADOS

Estatística de regressão
R múltiplo 0,9867
R-Quadrado 0,9736
R-quadrado ajustado 0,9472
Erro padrão 1,8099
Observações 5

ANOVA
gl SQ MQ F p

Regressão 2 241,45 120,72 36,86 0,026

Resíduo 2 6,55 3,28


Total 4 248,00

Coeficientes Erro padrão Stat t valor-P


-
Interseção - 19.098,126 6.184,29 3,09 0,091

X1 = ano modelo 9,5118 3,07 3,10 0,090

X2 = mil km 0,00945 0,12 0,08 0,944

Y = Preço X1 = ano X2 = mil Y chapéu Resíduo


modelo km ei
50 2013 0
40 2012 15
38 2012 30
32 2011 55
30 2011 40
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 75

Pressupostos em regressão múltipla:

1º) Os resíduos têm média zero.

2º) Os resíduos apresentam variância constante para i=1, 2, 3, ..., n

3º) As variáveis independentes X são não correlacionadas

4º) O número de observações deve ser maior do que o número de variáveis n > p.

5º) Os resíduos se distribuem normalmente, com média zero e variância constante.

6º) Os resíduos não são autocorrelacionados, ou seja, os resíduos não apresentam um


comportamento sistemático e se distribuem de maneira errática.

Na Regressão múltipla, temos testes de hipóteses específicos para cada coeficiente, além do
teste global.

Teste Global. Ho: 1=2=...=P=0

Causa de variação Graus Soma de Quadrado F Valor de p


de quadrados médio Significância
liberdade
Modelo de regressão p SQReg SQReg / p QMReg/QMErro
Erro ou resíduo n-p-1 SQErro SQErro / (n-p-1)
Total n-1 SQtotal

No caso dos testes específicos dos Betas, testa-se: Ho: i = 0 com a estatística t de
bj
Student: t 
S .E.(b j )

Exemplo – ENADE da Ciência da Computação

Y = Nota na prova do ENADE

X1=nota no ENEM
X2=Nota Infra
X3=Nota Mestrado
X4=Nota Doutorado
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 76

RESUMO DOS RESULTADOS

Estatística de regressão
R múltiplo 0,621274
R-Quadrado 0,385981
R-quadrado ajustado 0,377541
Erro padrão 0,713944
Observações 296

ANOVA
F de
gl SQ MQ F significação
Regressão 4 93,24 23,31 45,73 0,000
Resíduo 291 148,33 0,51
Total 295 241,57

Erro
Coeficientes padrão Stat t valor-P
Interseção -3,903 0,673 -5,80 0,000
Nota Enem Ingressantes 0,096 0,012 8,03 0,000
Nota de Infraestrutura 0,046 0,036 1,25 0,211
Nota Mestrado 0,118 0,046 2,57 0,011
Nota Doutorado 0,016 0,050 0,32 0,751

Interprete a saída.

A PUCRS obteve nota no ENADE de 2,9875. Estime a nota da PUCRS por meio da equação
sabendo que:
X1=nota no ENEM=61,58
X2=Nota Infra=4,69
X3=Nota Mestrado=5,00
X4=Nota Doutorado=3,26
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 77

7.3.1 – Diagnóstico de problemas em regressão linear múltipla

a) Multicolinearidade

A colinearidade entre variáveis independentes pode ser detectada de diferentes formas.


Normalmente, a presença de colinearidade gera uma erros-padrão “inflados” para os
coeficientes Beta. Além disso, esse problema pode gerar resultados aparentemente
contraditórios, como coeficientes com sinais contrários ao esperado.

Uma das formas de diagnosticar colinearidade é o cálculo do fator de inflação de variância


(VIF, Variance Inflation Factor).
1
VIF j 
1  R 2j

em que R 2j é o R da regressão de Xj sobre as outras variáveis explicativas.


2

O VIF mostra o quanto da variância do coeficiente é inflacionada por sua colinearidade.


Geralmente, um VIF>10 é tido com um indicativo de problemas de multicolinearidade.

Exemplo – ENADE da Ciência da Computação

a) Identifique no exemplo anterior os valores de VIF para cada variável.

Coefficientsa

Standardized
Unstandardized Coefficients Coefficients Collinearity Statistics

Model B Std. Error Beta t Sig. Tolerance VIF

1 (Constant) -3,903 ,673 -5,797 ,000

ENEM ,096 ,012 ,521 8,029 ,000 ,501 1,997

Infra ,046 ,036 ,062 1,256 ,210 ,869 1,151

Mestrado ,118 ,046 ,158 2,568 ,011 ,558 1,792

Doutorado ,016 ,050 ,022 ,317 ,752 ,432 2,313

a. Dependent Variable: Enade


Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 78

b) Autocorrelação

A verificar da hipótese de não existência de autocorrelação nos resíduos pode ser


realizada por meio de análise gráfica ou de testes de hipóteses. Com essas
técnicas pretende-se diagnosticar a independência dos resíduos.

Graficamente os resíduos podem ser plotados conforme a ordem de coleta. Uma


distribuição com comportamento errático é esperada se os resíduos forem não
autocorrelacionados.

O teste de Durbin-Watson é a prova mais comumente utilizada para esse fim.


Este teste é baseado na suposição de que os erros no modelo de regressão são gerados
por um processo autoregressivo de primeira ordem:
ei  ei1  ai

onde ei é o termo do erro do modelo na i-ésima observação e ai é um termo que simboliza


a parcela do ruído não explicada pela parcela autoregressiva. O  é o parâmetro de
autocorrelação: -1<<1. A presença de autocorrelação é testada pelas seguintes
hipóteses:

A estatística do teste de Durbin-Watson é dada por

em que A distribuição de depende da matriz X. Entretanto,


pode-se tomar a decisão comparando o valor de com os valores críticos e
da Tabela de Durbin-Watson:

 se
 se
 se
 se
 se
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 79

Quando temos evidência de uma correlação positiva. Já quando


, a correlação é negativa. No caso em que aceitamos ,
temos que não existe autocorrelação, ou seja, os resíduos são independentes.
Podemos também tomar a decisão pelo p-valor.

Tabela – Valores críticos do teste de Durbin-Watson para p=1,2,3,4 e 5 variáveis.


=0,05 e 0,01

c) Heterocedasticidade (extraído do Portal Action)

Homoscedasticidade é o termo para designar variância constante dos erros


para observações diferentes. O diagnóstico pode ser feito de modo gráfico ou
por meio de testes. O teste de Goldfeld-Quandt pode ser utilizado para testar
a homoscedasticidade dos resíduos, desde que haja amostra suficiente grande,
já que esse teste exige que a amostra seja dividida em três partes.

O teste consiste inicialmente em ordenar as observações de acordo com a


variável explicativa (Xj) que se acredita a responsável pela
heteroscedasticidade. Após isso, divide-se a amostra ordenada em 3 partes de
tal forma que a parte do meio tenha aproximadamente 20% dos dados e que
as partes 1 e 3 tenham quantidade de dados semelhantes. Então, ajusta-se um
modelo de regressão com os dados da parte 1 (contendo os menores valores
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 80

da variável explicativa utilizada na ordenação) e outro modelo de regressão


com os dados da parte 3 (contendo os maiores valores da variável explicativa
utilizada na ordenação). Por fim, testa-se a hipótese de que as variâncias dos
erros em ambas regressões são iguais contra a hipótese de que a variância dos
erros na parte 3 é maior do que a variância dos erros na parte 1, utilizando o
teste F.

A estatística de teste neste caso é dada por

em que e são as somas de quadrados dos resíduos da regressão


para o grupo inferior (parte a) e para o grupo superior (parte b),
respectivamente, é o número de observações da parte 1 e é o número de
observações da parte 3. Chamamos de d o número de observações omitidas
(parte 2). Essa estatística tem distribuição . Desta forma,
para um determinado nível de significância , rejeitaremos a hipótese nula, ou
seja, a hipótese de que as variâncias são iguais, se .

O teste de Goldfeld-Quandt pode ser substituído por uma análise visual gráfica
dos resíduos. Os resíduos devem se distribuir de maneira errática e dentro de
uma mesma faixa de variação.
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 81

7.3.2 – Variáveis dummy (dummies)

A criação de variáveis dummy é a forma mais comum de inclusão de variáveis


qualitativas em modelos de regressão. A forma mais comum para definição de
variáveis dummy é a criação de k-1 variáveis binárias (0 ou 1) para uma variável
com k categorias. Uma das k categorias é deixada de fora para evitar
multicolinearidade.

Exemplo: Variável estação do ano

X1 X2 X3

Primavera 1 0 0

Verão 0 1 0

Outono 0 0 1

Inverno 0 0 0

Exemplo – ENADE da Ciência da Computação com dummies


RESUMO DOS RESULTADOS

Estatística de regressão
R múltiplo 0,645374
R-Quadrado 0,416507
R-quadrado ajustado 0,404393
Erro padrão 0,698375
Observações 296

ANOVA
gl SQ MQ F p
Regressão 6 100,61 16,77 34,38 0,000
Resíduo 289 140,95 0,49
Total 295 241,57

Erro
Coeficientes padrão Stat t valor-P
Interseção -3,024 0,709 -4,27 0,000
Nota Enem Ingressantes 0,075 0,013 5,58 0,000
Nota de Infraestrutura 0,100 0,038 2,61 0,009
Nota Mestrado 0,144 0,046 3,16 0,002
Nota Doutorado -0,013 0,049 -0,25 0,800
Publica 0,451 0,132 3,41 0,001
Sul ou Sudeste -0,094 0,093 -1,01 0,313
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 82

TABELA Z

Tabela: Probabilidades acumuladas associadas aos valores críticos (z) da distribuição normal
reduzida
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879

0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389

1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319

1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767

2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936

2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986

3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 83

TABELA t
Tabela - Distribuição t de Student com gl graus de liberdade e área à direita p.
p
gl 0,100 0,050 0,025 0,010 0,005
1 3,078 6,314 12,706 31,821 63,657
2 1,886 2,920 4,303 6,965 9,925
3 1,638 2,353 3,182 4,541 5,841
4 1,533 2,132 2,776 3,747 4,604
5 1,476 2,015 2,571 3,365 4,032
6 1,440 1,943 2,447 3,143 3,707
7 1,415 1,895 2,365 2,998 3,499
8 1,397 1,860 2,306 2,896 3,355
9 1,383 1,833 2,262 2,821 3,250
10 1,372 1,812 2,228 2,764 3,169
11 1,363 1,796 2,201 2,718 3,106
12 1,356 1,782 2,179 2,681 3,055
13 1,350 1,771 2,160 2,650 3,012
14 1,345 1,761 2,145 2,624 2,977
15 1,341 1,753 2,131 2,602 2,947
16 1,337 1,746 2,120 2,583 2,921
17 1,333 1,740 2,110 2,567 2,898
18 1,330 1,734 2,101 2,552 2,878
19 1,328 1,729 2,093 2,539 2,861
20 1,325 1,725 2,086 2,528 2,845
21 1,323 1,721 2,080 2,518 2,831
22 1,321 1,717 2,074 2,508 2,819
23 1,319 1,714 2,069 2,500 2,807
24 1,318 1,711 2,064 2,492 2,797
25 1,316 1,708 2,060 2,485 2,787
26 1,315 1,706 2,056 2,479 2,779
27 1,314 1,703 2,052 2,473 2,771
28 1,313 1,701 2,048 2,467 2,763
29 1,311 1,699 2,045 2,462 2,756
30 1,310 1,697 2,042 2,457 2,750
40 1,303 1,684 2,021 2,423 2,704
50 1,299 1,676 2,009 2,403 2,678
60 1,296 1,671 2,000 2,390 2,660
120 1,289 1,658 1,980 2,358 2,617
Infinito 1,282 1,645 1,960 2,326 2,576
Tabela F
F(v1,v2;Alpha) Alpha= 0,100 (área à direita)
Numerador (v1)
Den (v2) 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 50 120 Inf.
1 39,86 49,50 53,59 55,83 57,24 58,20 58,91 59,44 59,86 60,19 60,71 61,22 61,74 62,00 62,26 62,53 62,69 63,06 63,33
2 8,53 9,00 9,16 9,24 9,29 9,33 9,35 9,37 9,38 9,39 9,41 9,42 9,44 9,45 9,46 9,47 9,47 9,48 9,49
3 5,54 5,46 5,39 5,34 5,31 5,28 5,27 5,25 5,24 5,23 5,22 5,20 5,18 5,18 5,17 5,16 5,15 5,14 5,13
4 4,54 4,32 4,19 4,11 4,05 4,01 3,98 3,95 3,94 3,92 3,90 3,87 3,84 3,83 3,82 3,80 3,80 3,78 3,76
5 4,06 3,78 3,62 3,52 3,45 3,40 3,37 3,34 3,32 3,30 3,27 3,24 3,21 3,19 3,17 3,16 3,15 3,12 3,11
6 3,78 3,46 3,29 3,18 3,11 3,05 3,01 2,98 2,96 2,94 2,90 2,87 2,84 2,82 2,80 2,78 2,77 2,74 2,72
7 3,59 3,26 3,07 2,96 2,88 2,83 2,78 2,75 2,72 2,70 2,67 2,63 2,59 2,58 2,56 2,54 2,52 2,49 2,47
8 3,46 3,11 2,92 2,81 2,73 2,67 2,62 2,59 2,56 2,54 2,50 2,46 2,42 2,40 2,38 2,36 2,35 2,32 2,29
9 3,36 3,01 2,81 2,69 2,61 2,55 2,51 2,47 2,44 2,42 2,38 2,34 2,30 2,28 2,25 2,23 2,22 2,18 2,16
10 3,29 2,92 2,73 2,61 2,52 2,46 2,41 2,38 2,35 2,32 2,28 2,24 2,20 2,18 2,16 2,13 2,12 2,08 2,06
11 3,23 2,86 2,66 2,54 2,45 2,39 2,34 2,30 2,27 2,25 2,21 2,17 2,12 2,10 2,08 2,05 2,04 2,00 1,97
12 3,18 2,81 2,61 2,48 2,39 2,33 2,28 2,24 2,21 2,19 2,15 2,10 2,06 2,04 2,01 1,99 1,97 1,93 1,90
13 3,14 2,76 2,56 2,43 2,35 2,28 2,23 2,20 2,16 2,14 2,10 2,05 2,01 1,98 1,96 1,93 1,92 1,88 1,85
14 3,10 2,73 2,52 2,39 2,31 2,24 2,19 2,15 2,12 2,10 2,05 2,01 1,96 1,94 1,91 1,89 1,87 1,83 1,80
15 3,07 2,70 2,49 2,36 2,27 2,21 2,16 2,12 2,09 2,06 2,02 1,97 1,92 1,90 1,87 1,85 1,83 1,79 1,76
16 3,05 2,67 2,46 2,33 2,24 2,18 2,13 2,09 2,06 2,03 1,99 1,94 1,89 1,87 1,84 1,81 1,79 1,75 1,72
17 3,03 2,64 2,44 2,31 2,22 2,15 2,10 2,06 2,03 2,00 1,96 1,91 1,86 1,84 1,81 1,78 1,76 1,72 1,69
18 3,01 2,62 2,42 2,29 2,20 2,13 2,08 2,04 2,00 1,98 1,93 1,89 1,84 1,81 1,78 1,75 1,74 1,69 1,66
19 2,99 2,61 2,40 2,27 2,18 2,11 2,06 2,02 1,98 1,96 1,91 1,86 1,81 1,79 1,76 1,73 1,71 1,67 1,63
20 2,97 2,59 2,38 2,25 2,16 2,09 2,04 2,00 1,96 1,94 1,89 1,84 1,79 1,77 1,74 1,71 1,69 1,64 1,61
21 2,96 2,57 2,36 2,23 2,14 2,08 2,02 1,98 1,95 1,92 1,87 1,83 1,78 1,75 1,72 1,69 1,67 1,62 1,59
22 2,95 2,56 2,35 2,22 2,13 2,06 2,01 1,97 1,93 1,90 1,86 1,81 1,76 1,73 1,70 1,67 1,65 1,60 1,57
23 2,94 2,55 2,34 2,21 2,11 2,05 1,99 1,95 1,92 1,89 1,84 1,80 1,74 1,72 1,69 1,66 1,64 1,59 1,55
24 2,93 2,54 2,33 2,19 2,10 2,04 1,98 1,94 1,91 1,88 1,83 1,78 1,73 1,70 1,67 1,64 1,62 1,57 1,53
25 2,92 2,53 2,32 2,18 2,09 2,02 1,97 1,93 1,89 1,87 1,82 1,77 1,72 1,69 1,66 1,63 1,61 1,56 1,52
26 2,91 2,52 2,31 2,17 2,08 2,01 1,96 1,92 1,88 1,86 1,81 1,76 1,71 1,68 1,65 1,61 1,59 1,54 1,50
27 2,90 2,51 2,30 2,17 2,07 2,00 1,95 1,91 1,87 1,85 1,80 1,75 1,70 1,67 1,64 1,60 1,58 1,53 1,49
28 2,89 2,50 2,29 2,16 2,06 2,00 1,94 1,90 1,87 1,84 1,79 1,74 1,69 1,66 1,63 1,59 1,57 1,52 1,48
29 2,89 2,50 2,28 2,15 2,06 1,99 1,93 1,89 1,86 1,83 1,78 1,73 1,68 1,65 1,62 1,58 1,56 1,51 1,47
30 2,88 2,49 2,28 2,14 2,05 1,98 1,93 1,88 1,85 1,82 1,77 1,72 1,67 1,64 1,61 1,57 1,55 1,50 1,46
40 2,84 2,44 2,23 2,09 2,00 1,93 1,87 1,83 1,79 1,76 1,71 1,66 1,61 1,57 1,54 1,51 1,48 1,42 1,38
50 2,81 2,41 2,20 2,06 1,97 1,90 1,84 1,80 1,76 1,73 1,68 1,63 1,57 1,54 1,50 1,46 1,44 1,38 1,33
60 2,79 2,39 2,18 2,04 1,95 1,87 1,82 1,77 1,74 1,71 1,66 1,60 1,54 1,51 1,48 1,44 1,41 1,35 1,29
120 2,75 2,35 2,13 1,99 1,90 1,82 1,77 1,72 1,68 1,65 1,60 1,55 1,48 1,45 1,41 1,37 1,34 1,26 1,19
Inf. 2,71 2,30 2,08 1,94 1,85 1,77 1,72 1,67 1,63 1,60 1,55 1,49 1,42 1,38 1,34 1,30 1,26 1,17 1,00
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 85

Tabela F
F(v1,v2;Alpha) Alpha= 0,05 (área à direita)
Numerador (v1)
Den (v2) 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 50 120 Inf.
1 161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 240,54 241,88 243,91 245,95 248,01 249,05 250,10 251,14 251,77 253,25 254,31
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,49 19,50
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,64 8,62 8,59 8,58 8,55 8,53
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,77 5,75 5,72 5,70 5,66 5,63
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,53 4,50 4,46 4,44 4,40 4,37
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87 3,84 3,81 3,77 3,75 3,70 3,67
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,32 3,27 3,23
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,02 2,97 2,93
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,80 2,75 2,71
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 2,74 2,70 2,66 2,64 2,58 2,54
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2,65 2,61 2,57 2,53 2,51 2,45 2,40
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,51 2,47 2,43 2,40 2,34 2,30
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46 2,42 2,38 2,34 2,31 2,25 2,21
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39 2,35 2,31 2,27 2,24 2,18 2,13
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,33 2,29 2,25 2,20 2,18 2,11 2,07
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28 2,24 2,19 2,15 2,12 2,06 2,01
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 2,23 2,19 2,15 2,10 2,08 2,01 1,96
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19 2,15 2,11 2,06 2,04 1,97 1,92
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16 2,11 2,07 2,03 2,00 1,93 1,88
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 2,08 2,04 1,99 1,97 1,90 1,84
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,18 2,10 2,05 2,01 1,96 1,94 1,87 1,81
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 2,07 2,03 1,98 1,94 1,91 1,84 1,78
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,13 2,05 2,01 1,96 1,91 1,88 1,81 1,76
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2,03 1,98 1,94 1,89 1,86 1,79 1,73
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2,01 1,96 1,92 1,87 1,84 1,77 1,71
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,07 1,99 1,95 1,90 1,85 1,82 1,75 1,69
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,13 2,06 1,97 1,93 1,88 1,84 1,81 1,73 1,67
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,12 2,04 1,96 1,91 1,87 1,82 1,79 1,71 1,65
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,10 2,03 1,94 1,90 1,85 1,81 1,77 1,70 1,64
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1,93 1,89 1,84 1,79 1,76 1,68 1,62
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 1,84 1,79 1,74 1,69 1,66 1,58 1,51
50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,95 1,87 1,78 1,74 1,69 1,63 1,60 1,51 1,44
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,84 1,75 1,70 1,65 1,59 1,56 1,47 1,39
120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91 1,83 1,75 1,66 1,61 1,55 1,50 1,46 1,35 1,25
Inf. 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,67 1,57 1,52 1,46 1,39 1,35 1,22 1,00
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 86

Tabela F
F(v1,v2;Alpha) Alpha= 0,025 (área à direita)
Numerador (v1)
Den (v2) 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 50 120 Inf.
1 648 799 864 900 922 937 948 957 963 969 977 985 993 997 1001 1006 1008 1014 1018
2 38,51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,41 39,43 39,45 39,46 39,46 39,47 39,48 39,49 39,50
3 17,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,34 14,25 14,17 14,12 14,08 14,04 14,01 13,95 13,90
4 12,22 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,90 8,84 8,75 8,66 8,56 8,51 8,46 8,41 8,38 8,31 8,26
5 10,01 8,43 7,76 7,39 7,15 6,98 6,85 6,76 6,68 6,62 6,52 6,43 6,33 6,28 6,23 6,18 6,14 6,07 6,02
6 8,81 7,26 6,60 6,23 5,99 5,82 5,70 5,60 5,52 5,46 5,37 5,27 5,17 5,12 5,07 5,01 4,98 4,90 4,85
7 8,07 6,54 5,89 5,52 5,29 5,12 4,99 4,90 4,82 4,76 4,67 4,57 4,47 4,41 4,36 4,31 4,28 4,20 4,14
8 7,57 6,06 5,42 5,05 4,82 4,65 4,53 4,43 4,36 4,30 4,20 4,10 4,00 3,95 3,89 3,84 3,81 3,73 3,67
9 7,21 5,71 5,08 4,72 4,48 4,32 4,20 4,10 4,03 3,96 3,87 3,77 3,67 3,61 3,56 3,51 3,47 3,39 3,33
10 6,94 5,46 4,83 4,47 4,24 4,07 3,95 3,85 3,78 3,72 3,62 3,52 3,42 3,37 3,31 3,26 3,22 3,14 3,08
11 6,72 5,26 4,63 4,28 4,04 3,88 3,76 3,66 3,59 3,53 3,43 3,33 3,23 3,17 3,12 3,06 3,03 2,94 2,88
12 6,55 5,10 4,47 4,12 3,89 3,73 3,61 3,51 3,44 3,37 3,28 3,18 3,07 3,02 2,96 2,91 2,87 2,79 2,73
13 6,41 4,97 4,35 4,00 3,77 3,60 3,48 3,39 3,31 3,25 3,15 3,05 2,95 2,89 2,84 2,78 2,74 2,66 2,60
14 6,30 4,86 4,24 3,89 3,66 3,50 3,38 3,29 3,21 3,15 3,05 2,95 2,84 2,79 2,73 2,67 2,64 2,55 2,49
15 6,20 4,77 4,15 3,80 3,58 3,41 3,29 3,20 3,12 3,06 2,96 2,86 2,76 2,70 2,64 2,59 2,55 2,46 2,40
16 6,12 4,69 4,08 3,73 3,50 3,34 3,22 3,12 3,05 2,99 2,89 2,79 2,68 2,63 2,57 2,51 2,47 2,38 2,32
17 6,04 4,62 4,01 3,66 3,44 3,28 3,16 3,06 2,98 2,92 2,82 2,72 2,62 2,56 2,50 2,44 2,41 2,32 2,25
18 5,98 4,56 3,95 3,61 3,38 3,22 3,10 3,01 2,93 2,87 2,77 2,67 2,56 2,50 2,44 2,38 2,35 2,26 2,19
19 5,92 4,51 3,90 3,56 3,33 3,17 3,05 2,96 2,88 2,82 2,72 2,62 2,51 2,45 2,39 2,33 2,30 2,20 2,13
20 5,87 4,46 3,86 3,51 3,29 3,13 3,01 2,91 2,84 2,77 2,68 2,57 2,46 2,41 2,35 2,29 2,25 2,16 2,09
21 5,83 4,42 3,82 3,48 3,25 3,09 2,97 2,87 2,80 2,73 2,64 2,53 2,42 2,37 2,31 2,25 2,21 2,11 2,04
22 5,79 4,38 3,78 3,44 3,22 3,05 2,93 2,84 2,76 2,70 2,60 2,50 2,39 2,33 2,27 2,21 2,17 2,08 2,00
23 5,75 4,35 3,75 3,41 3,18 3,02 2,90 2,81 2,73 2,67 2,57 2,47 2,36 2,30 2,24 2,18 2,14 2,04 1,97
24 5,72 4,32 3,72 3,38 3,15 2,99 2,87 2,78 2,70 2,64 2,54 2,44 2,33 2,27 2,21 2,15 2,11 2,01 1,94
25 5,69 4,29 3,69 3,35 3,13 2,97 2,85 2,75 2,68 2,61 2,51 2,41 2,30 2,24 2,18 2,12 2,08 1,98 1,91
26 5,66 4,27 3,67 3,33 3,10 2,94 2,82 2,73 2,65 2,59 2,49 2,39 2,28 2,22 2,16 2,09 2,05 1,95 1,88
27 5,63 4,24 3,65 3,31 3,08 2,92 2,80 2,71 2,63 2,57 2,47 2,36 2,25 2,19 2,13 2,07 2,03 1,93 1,85
28 5,61 4,22 3,63 3,29 3,06 2,90 2,78 2,69 2,61 2,55 2,45 2,34 2,23 2,17 2,11 2,05 2,01 1,91 1,83
29 5,59 4,20 3,61 3,27 3,04 2,88 2,76 2,67 2,59 2,53 2,43 2,32 2,21 2,15 2,09 2,03 1,99 1,89 1,81
30 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,57 2,51 2,41 2,31 2,20 2,14 2,07 2,01 1,97 1,87 1,79
40 5,42 4,05 3,46 3,13 2,90 2,74 2,62 2,53 2,45 2,39 2,29 2,18 2,07 2,01 1,94 1,88 1,83 1,72 1,64
50 5,34 3,97 3,39 3,05 2,83 2,67 2,55 2,46 2,38 2,32 2,22 2,11 1,99 1,93 1,87 1,80 1,75 1,64 1,55
60 5,29 3,93 3,34 3,01 2,79 2,63 2,51 2,41 2,33 2,27 2,17 2,06 1,94 1,88 1,82 1,74 1,70 1,58 1,48
120 5,15 3,80 3,23 2,89 2,67 2,52 2,39 2,30 2,22 2,16 2,05 1,94 1,82 1,76 1,69 1,61 1,56 1,43 1,31
Inf. 5,02 3,69 3,12 2,79 2,57 2,41 2,29 2,19 2,11 2,05 1,94 1,83 1,71 1,64 1,57 1,48 1,43 1,27 1,00
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 87

Tabela F
F(v1,v2;Alpha) Alpha= 0,01 (área à direita)
Numerador (v1)
Den (v2) 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 50 120 Inf.
1 4052 4999 5403 5625 5764 5859 5928 5981 6022 6056 6106 6157 6209 6235 6261 6287 6303 6339 6366
2 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39 99,40 99,42 99,43 99,45 99,46 99,47 99,47 99,48 99,49 99,50
3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23 27,05 26,87 26,69 26,60 26,50 26,41 26,35 26,22 26,13
4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,37 14,20 14,02 13,93 13,84 13,75 13,69 13,56 13,46
5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,89 9,72 9,55 9,47 9,38 9,29 9,24 9,11 9,02
6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,72 7,56 7,40 7,31 7,23 7,14 7,09 6,97 6,88
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,47 6,31 6,16 6,07 5,99 5,91 5,86 5,74 5,65
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,67 5,52 5,36 5,28 5,20 5,12 5,07 4,95 4,86
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,11 4,96 4,81 4,73 4,65 4,57 4,52 4,40 4,31
10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,71 4,56 4,41 4,33 4,25 4,17 4,12 4,00 3,91
11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,40 4,25 4,10 4,02 3,94 3,86 3,81 3,69 3,60
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,16 4,01 3,86 3,78 3,70 3,62 3,57 3,45 3,36
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 3,96 3,82 3,66 3,59 3,51 3,43 3,38 3,25 3,17
14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,80 3,66 3,51 3,43 3,35 3,27 3,22 3,09 3,00
15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,67 3,52 3,37 3,29 3,21 3,13 3,08 2,96 2,87
16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,55 3,41 3,26 3,18 3,10 3,02 2,97 2,84 2,75
17 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,46 3,31 3,16 3,08 3,00 2,92 2,87 2,75 2,65
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,37 3,23 3,08 3,00 2,92 2,84 2,78 2,66 2,57
19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,30 3,15 3,00 2,92 2,84 2,76 2,71 2,58 2,49
20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,23 3,09 2,94 2,86 2,78 2,69 2,64 2,52 2,42
21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 3,17 3,03 2,88 2,80 2,72 2,64 2,58 2,46 2,36
22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 3,12 2,98 2,83 2,75 2,67 2,58 2,53 2,40 2,31
23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 3,07 2,93 2,78 2,70 2,62 2,54 2,48 2,35 2,26
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 3,03 2,89 2,74 2,66 2,58 2,49 2,44 2,31 2,21
25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 2,99 2,85 2,70 2,62 2,54 2,45 2,40 2,27 2,17
26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 2,96 2,81 2,66 2,58 2,50 2,42 2,36 2,23 2,13
27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 2,93 2,78 2,63 2,55 2,47 2,38 2,33 2,20 2,10
28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 2,90 2,75 2,60 2,52 2,44 2,35 2,30 2,17 2,06
29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 2,87 2,73 2,57 2,49 2,41 2,33 2,27 2,14 2,03
30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,84 2,70 2,55 2,47 2,39 2,30 2,25 2,11 2,01
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,66 2,52 2,37 2,29 2,20 2,11 2,06 1,92 1,80
50 7,17 5,06 4,20 3,72 3,41 3,19 3,02 2,89 2,78 2,70 2,56 2,42 2,27 2,18 2,10 2,01 1,95 1,80 1,68
60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,50 2,35 2,20 2,12 2,03 1,94 1,88 1,73 1,60
120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56 2,47 2,34 2,19 2,03 1,95 1,86 1,76 1,70 1,53 1,38
Inf. 6,64 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 2,18 2,04 1,88 1,79 1,70 1,59 1,52 1,32 1,00
Probabilidade & Estatística – Prof. Hélio Radke Bittencourt Pág. 88

Tabela F
F(v1,v2;Alpha) Alpha= 0,005 (área à direita)
Numerador (v1)
Den (v2) 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 50 120 Inf.
1 16211 19999 21615 22500 23056 23437 23715 23925 24091 24224 24426 24630 24836 24940 25044 25148 25211 25359 25464
2 198,50 199,00 199,17 199,25 199,30 199,33 199,36 199,37 199,39 199,40 199,42 199,43 199,45 199,46 199,47 199,47 199,48 199,49 199,50
3 55,55 49,80 47,47 46,19 45,39 44,84 44,43 44,13 43,88 43,69 43,39 43,08 42,78 42,62 42,47 42,31 42,21 41,99 41,83
4 31,33 26,28 24,26 23,15 22,46 21,97 21,62 21,35 21,14 20,97 20,70 20,44 20,17 20,03 19,89 19,75 19,67 19,47 19,32
5 22,78 18,31 16,53 15,56 14,94 14,51 14,20 13,96 13,77 13,62 13,38 13,15 12,90 12,78 12,66 12,53 12,45 12,27 12,14
6 18,63 14,54 12,92 12,03 11,46 11,07 10,79 10,57 10,39 10,25 10,03 9,81 9,59 9,47 9,36 9,24 9,17 9,00 8,88
7 16,24 12,40 10,88 10,05 9,52 9,16 8,89 8,68 8,51 8,38 8,18 7,97 7,75 7,64 7,53 7,42 7,35 7,19 7,08
8 14,69 11,04 9,60 8,81 8,30 7,95 7,69 7,50 7,34 7,21 7,01 6,81 6,61 6,50 6,40 6,29 6,22 6,06 5,95
9 13,61 10,11 8,72 7,96 7,47 7,13 6,88 6,69 6,54 6,42 6,23 6,03 5,83 5,73 5,62 5,52 5,45 5,30 5,19
10 12,83 9,43 8,08 7,34 6,87 6,54 6,30 6,12 5,97 5,85 5,66 5,47 5,27 5,17 5,07 4,97 4,90 4,75 4,64
11 12,23 8,91 7,60 6,88 6,42 6,10 5,86 5,68 5,54 5,42 5,24 5,05 4,86 4,76 4,65 4,55 4,49 4,34 4,23
12 11,75 8,51 7,23 6,52 6,07 5,76 5,52 5,35 5,20 5,09 4,91 4,72 4,53 4,43 4,33 4,23 4,17 4,01 3,90
13 11,37 8,19 6,93 6,23 5,79 5,48 5,25 5,08 4,94 4,82 4,64 4,46 4,27 4,17 4,07 3,97 3,91 3,76 3,65
14 11,06 7,92 6,68 6,00 5,56 5,26 5,03 4,86 4,72 4,60 4,43 4,25 4,06 3,96 3,86 3,76 3,70 3,55 3,44
15 10,80 7,70 6,48 5,80 5,37 5,07 4,85 4,67 4,54 4,42 4,25 4,07 3,88 3,79 3,69 3,58 3,52 3,37 3,26
16 10,58 7,51 6,30 5,64 5,21 4,91 4,69 4,52 4,38 4,27 4,10 3,92 3,73 3,64 3,54 3,44 3,37 3,22 3,11
17 10,38 7,35 6,16 5,50 5,07 4,78 4,56 4,39 4,25 4,14 3,97 3,79 3,61 3,51 3,41 3,31 3,25 3,10 2,98
18 10,22 7,21 6,03 5,37 4,96 4,66 4,44 4,28 4,14 4,03 3,86 3,68 3,50 3,40 3,30 3,20 3,14 2,99 2,87
19 10,07 7,09 5,92 5,27 4,85 4,56 4,34 4,18 4,04 3,93 3,76 3,59 3,40 3,31 3,21 3,11 3,04 2,89 2,78
20 9,94 6,99 5,82 5,17 4,76 4,47 4,26 4,09 3,96 3,85 3,68 3,50 3,32 3,22 3,12 3,02 2,96 2,81 2,69
21 9,83 6,89 5,73 5,09 4,68 4,39 4,18 4,01 3,88 3,77 3,60 3,43 3,24 3,15 3,05 2,95 2,88 2,73 2,61
22 9,73 6,81 5,65 5,02 4,61 4,32 4,11 3,94 3,81 3,70 3,54 3,36 3,18 3,08 2,98 2,88 2,82 2,66 2,55
23 9,63 6,73 5,58 4,95 4,54 4,26 4,05 3,88 3,75 3,64 3,47 3,30 3,12 3,02 2,92 2,82 2,76 2,60 2,48
24 9,55 6,66 5,52 4,89 4,49 4,20 3,99 3,83 3,69 3,59 3,42 3,25 3,06 2,97 2,87 2,77 2,70 2,55 2,43
25 9,48 6,60 5,46 4,84 4,43 4,15 3,94 3,78 3,64 3,54 3,37 3,20 3,01 2,92 2,82 2,72 2,65 2,50 2,38
26 9,41 6,54 5,41 4,79 4,38 4,10 3,89 3,73 3,60 3,49 3,33 3,15 2,97 2,87 2,77 2,67 2,61 2,45 2,33
27 9,34 6,49 5,36 4,74 4,34 4,06 3,85 3,69 3,56 3,45 3,28 3,11 2,93 2,83 2,73 2,63 2,57 2,41 2,29
28 9,28 6,44 5,32 4,70 4,30 4,02 3,81 3,65 3,52 3,41 3,25 3,07 2,89 2,79 2,69 2,59 2,53 2,37 2,25
29 9,23 6,40 5,28 4,66 4,26 3,98 3,77 3,61 3,48 3,38 3,21 3,04 2,86 2,76 2,66 2,56 2,49 2,33 2,21
30 9,18 6,35 5,24 4,62 4,23 3,95 3,74 3,58 3,45 3,34 3,18 3,01 2,82 2,73 2,63 2,52 2,46 2,30 2,18
40 8,83 6,07 4,98 4,37 3,99 3,71 3,51 3,35 3,22 3,12 2,95 2,78 2,60 2,50 2,40 2,30 2,23 2,06 1,93
50 8,63 5,90 4,83 4,23 3,85 3,58 3,38 3,22 3,09 2,99 2,82 2,65 2,47 2,37 2,27 2,16 2,10 1,93 1,79
60 8,49 5,79 4,73 4,14 3,76 3,49 3,29 3,13 3,01 2,90 2,74 2,57 2,39 2,29 2,19 2,08 2,01 1,83 1,69
120 8,18 5,54 4,50 3,92 3,55 3,28 3,09 2,93 2,81 2,71 2,54 2,37 2,19 2,09 1,98 1,87 1,80 1,61 1,43
Inf. 7,88 5,30 4,28 3,72 3,35 3,09 2,90 2,74 2,62 2,52 2,36 2,19 2,00 1,90 1,79 1,67 1,59 1,36 1,00