Vous êtes sur la page 1sur 83

UNIVERSIDADE ESTADUAL DE MARINGÁ

DEPARTAMENTO DE ESTATÍSTICA
CURSO DE ENGENHARIA CIVIL

PROFª: VALENTINA DE LOURDES MILANI

2009
2
I - INTRODUÇÃO

1. OBJETIVOS DA DISCIPLINA: Capacitar o acadêmico a:

-Coletar e organizar dados.


-Apresentar os dados por intermédio de tabelas e/ou gráficos.
-Analisar dados aplicando os recursos estatísticos necessários.
-Fazer inferências e previsões interpretando os resultados numéricos fornecidos através dos recursos
estatísticos.
-Utilizar profissionalmente métodos científicos da teoria estatística em seu campo de trabalho.
=Entender a literatura científica da área.

2. DEFINIÇÃO: Estatística é um conjunto de conceitos e métodos científicos para a coleta, a organização, a


descrição, a análise e a interpretação de dados experimentais, que permitem conclusões válidas e tomadas de
decisões razoáveis. Segundo Levasseur: A estatística é o estudo numérico dos fatos sociais.

3. CLASSIFIÇÃO: Usualmente, a estatística é dividida em três grandes áreas que atuam em conjunto:
amostragem e planejamentos de experimentos, estatística descritiva e estatística inferencial.

3.1 – PLANEJAMENTO DE EXPERIMENTOS E AMOSTRAGEM: É a parte que tem por


objetivo planejar a pesquisa e se preocupa com o mecanismo da coleta de dados.

3.2 - ESTATÍSTICA DESCRITIVA: É a parte da Estatística que tem por objetivo organizar,
apresentar e sintetizar dados observados de determinada população, sem pretender conclusões de caráter
extensivo.

3.3 - ESTATÍSTICA INDUTIVA OU INFERENCIAL: É a parte da Estatística que, baseando-se


em estudos realizados sobre os dados de uma amostra, procura inferir, induzir ou verificar leis de
comportamento da população da qual a amostra foi retirada. A estatística inferencial tem sua estrutura
fundamentada na teoria matemática das probabilidades. É também definida como um conjunto de métodos
para a tomada de decisões.

Na estatística indutiva ou inferencial destacamos:

a) Estimação de parâmetros: Esta fase envolve a obtenção da melhor estimativa possível de um


parâmetro da população, a partir dos dados coletados. Será necessário estimar valores
desconhecidos quando eles são impossíveis de serem conhecidos com exatidão. Por exemplo: as
vendas dos produtos da empresa nos próximo ano, o vencedor na próxima eleição, a rentabilidade
das ações no próximo mês, etc. A qualidade da estimação está estreitamente ligada à qualidade
dos dados coletados e, às vezes, pode estar errada.
b) Testes de hipóteses: É o uso dos dados para verificar afirmações sobre parâmetros da população.
Por exemplo: o aumento das taxas de juros não está estimulando os investidores a investir no
mercado de ações; o erro cometido nos demonstrativos financeiros mensais é menor que as
despesas mensais com xerox, etc. Os testes de hipóteses são um meio de decidir qual das
afirmações é correta, dentro de um erro tolerável.
3
4 - LEVANTAMENTO ESTATÍSTICO DE DADOS

Os dados são a matéria prima da Estatística. Definido o assunto de interesse, os dados são obtidos da
medição de determinada característica ou propriedade desse objeto, pessoa ou coisa. O levantamento dos
dados deve ser feito com muito cuidado pois dele dependerá o sucesso da análise estatística.

- ETAPAS DE UM LEVANTAMENTO ESTATÍSTICO

4.1 - PLANEJAMENTO EXPERIMENTAL


Consiste no planejamento da pesquisa que será realizada:
O Que? - Definir o problema. As etapas seguintes serão planejadas após ter ficado claro qual
o problema a ser investigado.
Para que? - Definir claramente o(s) objetivo(s) da pesquisa.
Onde? – Definir o espaço físico.
Em quem? - Definir as entidades que serão verificadas.
Em quantos? - O número de entidades a serem pesquisadas deve ser fixado segundo a
precisão desejada nos resultados que serão obtidos. As normas para a fixação deste número serão dadas no
decorrer desta disciplina.

4.2 - AVALIAÇÃO DE INFORMAÇÕES EXISTENTES


Inicialmente, deve-se realizar um levantamento bibliográfico sobre o assunto para obter
subsídios que podem representar valiosa colaboração para o estudo e, também, serem aproveitados nas
discussões posteriores.

4.3– FORMULAÇÃO DE HIPÓTESES


Com exceção das pesquisas meramente descritivas, todas as pesquisas estatísticas comportam
a formulação de hipóteses.
Com base nos dados observados, a hipótese será rejeitada ou não.

4.4 - VERIFICAÇÃO DAS HIPÓTESES


A verificação das hipóteses será realizada no decorrer da pesquisa.

4.5– DELINEAMENTO DA PESQUISA


Compreende o estudo (planejamento) detalhado da coleta de dados, da realização do trabalho
e da análise dos dados.
Os dados podem ser retirados diretamente da fonte ou aproveitados de bancos de dados
retirados por outros indivíduos.
Para o caso de dados retirados diretamente da fonte, existem 3 procedimentos: a observação, o
questionário ou interrogatório e a entrevista.
Observação: é a observação direta dos fenômenos em laboratórios ou na natureza.
Questionário: é uma seqüência de perguntas previamente preparadas e aplicado por meio de
entrevista ou remetido pelo correio. Os valores observados podem ser complementados por observação.

4.6 – EXECUÇÃO DA PESQUISA


Coleta dos dados.
Realização da análise estatística.

4.7 – ANÁLISE E APRESENTAÇÃO DOS RESULTADOS


Os dados coletados devem ser apresentados na forma de: gráficos e/ou de tabelas.
A análise dos dados deve ser realizada pelo pesquisador, com a ajuda de um estatístico,
aplicando os recursos estatísticos necessários para refutar ou não as hipóteses previamente formuladas.
4
II – AMOSTRAGEM – COLETA DE DADOS

A amostragem é naturalmente usada na vida diária. Por exemplo, para verificar o tempero de um
alimento em preparação, pode-se provar (observar) uma pequena porção deste alimento. Desta forma, está se
fazendo uma amostragem, ou seja, extraindo do todo (população) uma parte (amostra), com o propósito de
avaliar (inferir) a qualidade de tempero de todo o alimento.
Nas pesquisas científicas em que se quer conhecer algumas características de uma população,
também é muito comum se observar apenas uma amostra de seus elementos e, a partir dos resultados dessa
amostra, obter valores aproximados, ou estimativas, para as características populacionais de interesse. Este
tipo de pesquisa é usualmente chamado de levantamento por amostragem.
Num levantamento por amostragem, a seleção dos elementos que serão observados, deve ser feita sob
uma metodologia adequada, de tal forma que os resultados da amostra sejam informativos para avaliar
características de toda a população.
A população pode ser formada por pessoas da família, indivíduos de uma certa espécie,
estabelecimentos industriais, ou qualquer outro tipo de elementos, cujas variáveis que se pretende estudar
sejam passíveis de serem mensuradas.
Os elementos de uma população diferem entre si com respeito a fatores tais como: sexo, idade,
medidas físicas, cor, susceptibilidade a doença, agressividade, etc. Desta forma o padrão de comportamento
no qual o pesquisador esta interessado pode ser muito complicado pela grande variabilidade existente. Por
estas razões, muitos trabalhos tendem a ser de natureza comparativa, procurando lidar com estas variações
inerentes. Alguns exemplos: pode-se estudar o número médio de ovos de uma certa espécie de pássaros sob
uma condição ambiental particular, ou a proporção de sujeitos protegidos por uma certa vacina imunológica,
etc.

2.1 – DEFINIÇÕES

POPULAÇÃO: é qualquer conjunto de elementos que descreve algum fenômeno do nosso interesse
(o todo). Pesquisas utilizando todos os elementos da população denominam-se censo.

AMOSTRA: é qualquer subconjunto da população. Pesquisas utilizando amostras da população


denominam-se pesquisa por amostragem.

PARÂMETROS: são certas características que especificam a população. Genericamente


representado por θ . exemplos Alguns exemplos são: média (µ), a variância ( σ 2 ), o coeficiente de
correlação ( ρ ).

INFERÊNCIA ESTATÍSTICA: refere-se ao uso apropriado dos dados da amostra, para se ter
conhecimento sobre os parâmetros da população.

ESTIMADOR, ESTATÍSTICA DE UM PARÂMETROS: qualquer função de uma amostra.


Genericamente representada por θˆ . Exemplos de estimador: média amostral ( x ), a variância amostral ( S 2 ),
coeficiente de correlação (r).

ESTIMATIVA: é o valor numérico determinado pelo estimador genericamente representado por : .


θˆ 0 .
UNIDADE DE AMOSTRAGEM: é a unidade a ser selecionada para se chegar aos elementos da
população. Pode ser os próprios elementos da população, ou outras unidades fáceis de serem selecionadas e
que, de alguma forma, estejam associadas aos elementos da população.

VARIÁVEIS: são as características, propriedades ou atributos de uma unidade da população, cujo


valor pode variar de uma unidade para outra. Portanto, as variáveis apresentam variabilidade dentro da
população. Podem ser qualitativas ou quantitativas.
5

VARIÁVEIS QUALITATIVAS: quando seus valores forem expressos por atributos (não-
numéricos). Podem ser:
- nominal quando tem nome (sexo, estado civil, nacionalidade, ...)
- ordinal quando tem ordem (primeiro, segundo,...).

VARIÁVEIS QUANTITATIVAS: quando seus valores podem ser descritos numericamente.


Podem ser:
- discreta quando seus valores resultam de contagem (números inteiros), (número de
vendas diárias, número de filhos, número de peças com defeito na produção mensal, ...).
- contínua quando seus valores resultam de medições e podem assumir qualquer
valor em um intervalo da reta (números decimais), (valor das vendas diárias, consumo mensal de energia
elétrica, peso, altura, temperatura, ...).

2.2 - POR QUE AMOSTRAGEM ?

-ECONOMIA. Em geral, torna-se bem mais econômico o levantamento de somente uma parte da
população.

-TEMPO. Em geral a pesquisa por amostragem é bem mais rápida que o censo. Numa pesquisa
eleitoral, a três dias de uma eleição presidencial não haveria tempo suficiente para pesquisar a população de
eleitores do país, mesmo que houvesse recurso financeiro em abundância.

-CONFIABILIDADE DOS DADOS. Quando se pesquisa um número reduzido de elementos, pode-


se dar mais atenção aos casos individuais, evitando erros nas respostas.

-OPERACIONALIDADE. É mais fácil realizar operações de pequena escala. Um dos problemas


típicos nos grandes censos é o controle dos entrevistados.

2.3 - SITUAÇÕES EM QUE O USO DA AMOSTRAGEM NÃO É INTERESSANTE

POPULAÇÃO PEQUENA. Sob o enfoque de amostragem aleatórias que será estudado no próximo
item, se a população for pequena (digamos de 50 elementos ou menos) para se ter uma amostra capaz de
gerar resultados precisos para os parâmetros da população, será necessário uma amostra relativamente
grande (em torno de 80% da população).

CARACTERÍSTICA DE FÁCIL MENSURAÇÃO. Mesmo que a população não seja tão pequena,
a variável que se quer observar pode ser de tão fácil mensuração, que não compensa investir num plano de
amostragem. Por exemplo, para verificar a porcentagem de funcionários favoráveis à mudança no horário de
um turno de trabalho, pode-se entrevistar toda a população no próprio local de trabalho.

NECESSIDADE DE ALTA PRECISÃO. A cada dez anos o IBGE realiza um censo demográfico
para estudar diversas características da população brasileira. Dentre estas características têm-se o parâmetro
número de habitantes residentes no país, que é fundamental para o planejamento do país. Desta forma este
parâmetro precisa ser avaliado com grande precisão e, por isto, se pesquisa toda a população.

2.4 - PLANO DE AMOSTRAGEM

Para se fazer um plano de amostragem é necessário ter bem definidos os objetivos da pesquisa, a
população a ser amostrada, bem como os parâmetros que precisam ser estimados para atingir os objetivos
6
da pesquisa. Num plano de amostragem deve constar as variáveis, a definição da unidade de
amostragem, a forma de seleção dos elementos da população e o tamanho da amostra.

2.5 - AMOSTRAS PROBABILÍSTICAS E NÃO PROBABILÍSTICAS

A seleção dos elementos que farão parte da amostra pode ser feita sob alguma forma de sorteio ou
por escolha deliberada. As amostras obtidas através de algum tipo de sorteio são chamadas amostras
probabilísticas ou aleatórias, sendo que cada elemento da população tem a mesma chance de ser escolhido, e
cada elemento escolhido de forma independente dos outros.
Todas as amostras de tamanho n possíveis de serem formadas e extraídas de uma população têm a
mesma chance de serem selecionadas.
Estes tipos de amostragens são particularmente interessantes por permitirem a utilização das técnicas
clássicas de inferência estatísticas, facilitando a análise dos dados e fornecendo maior segurança ao
generalizar resultados da amostra para a população.

As amostras não aleatórias ou não probabilísticas podem levar a resultados úteis, não se prestam,
entretanto, à utilização de processos estatísticos inferênciais.

Exemplos de casos de amostragens não probabilísticas:


- Amostragem sem critério(escolha desordenada);
- Amostragem intencional (o pesquisador escolhe certos elementos para a amostra);
- Amostragem com desigualdade de acesso aos elementos da população (há elementos com mais facilidade
de figurarem na amostra).

2.6 - ALGUNS TIPOS DE AMOSTRAGENS PROBABILíSTICAS

2.6.1 - AMOSTRAGEM ALEATÓRIA SIMPLES.


Para a seleção de uma amostra aleatória simples é necessário ter uma lista completa dos elementos da
população (ou de unidades de amostragens apropriadas). Este tipo de amostragem consiste em selecionar a
amostra através de um sorteio, sem restrição
Seja uma única população com N elementos. Uma forma de extrair uma amostra aleatória simples de
tamanho n, sendo n < N, é identificar os elementos da população em pequenos pedaços de papel e retirar, ao
acaso, n pedaços. Será considerado sorteio realizado sem reposição.
A amostragem aleatória simples tem a seguinte propriedade: qualquer subconjunto da população,
com o mesmo número de elementos, tem a mesma chance de fazer parte da amostra. Em particular tem-
se que cada elemento da população tem a mesma probabilidade de pertencer à amostra.

O USO DE TABELAS DE NÚMEROS ALEATÓRIOS

As tabelas de números aleatórios facilitam o processo de seleção de uma amostra aleatória simples.
Tais tabelas são formadas por sucessivos sorteios de algarismos do conjunto {0, 1, 2, 3,..., 9}, com
reposição.

Procedimento:
1) Enumerar todos os elementos da população.
2) Sortiar uma linha ou coluna da tabela de números aleatórios.
3) Ler os números na tabela de números aleatórios de modo que o número de algarismos em cada um seja
igual ao número de algarismos do último da sua listagem. Assim, se o último número é 56, devem ser lidos
números com dois algarismos.
4) Desprezar quaisquer números que não correspondam a números da lista. No caso de amostragem sem
reposição, despreze também os números que sejam repetições de números lidos anteriormente. Continue o
processo até obter o número desejado de observações.
7
5) Usar os números assim escolhidos para identificar os itens da lista a serem incluídos na amostra.

Exemplo 5 : Uma grande industria fabricante tinta, com diversas filiais no país, passou a receber no últimos
meses, diversas reclamações sobre a qualidade de um de seus principais produtos. Na tarefa de escolha e
análise das causas mais prováveis para o problema, a equipe técnica da indústria desejava confirmar sua
hipótese de que a causa fundamental era a existência de diferenças na qualidade da matéria prima (cromita)
vendida pelos 32 fornecedores da empresa. Existia a suspeita de que os lotes de cromita vendidos diferiam
em relação ao teor médio de Cr 2 O 3 que este fator estava comprometendo a qualidade do produto. Para
agilizar a análise do problema a empresa realizou o estudo por amostragem usando apenas 10 fornecedores e
os resultados obtidos p/ teor de Cr 2 O 3 em 13 lotes entregue por cada um deles. Na tabela abaixo estão
representados os fornecedores e os resultados obtidos p/ o teor de Cr 2 O 3 do último lote de matéria prima
entregue por cada um respectivamente:
POPULAÇÃO
01-Cromix (46) 08-Cromil (45) 15-Sicrosul (47) 22-Incromit (51) 29-Cromilpa (47)
02-Incroeste (46) 09-Sicroval (43) 16-Macroval (47) 23-Cromisp (43) 30-Incropar (44)
03-Macrosul (43) 10-Cromitax (51) 17-Cromipar (51) 24-Incromar (48) 31-Cromisul (43)
04-Cromalt (48) 11-Cromixel (46) 18-Incrosul (42) 25-Cromipe (44) 32-Incrosc (49)
05-Incovalt (46) 12-Crominas (44) 19-Incruscrom (45) 26-Cromiba (46) 33-Crominor (44)
06-Sincroest (46) 13-Cromalesp (44) 20-Cromisc (49) 27-Macropar (52) 34-Sicropol (48)
07-Cromax (50) 14-Cromalesc (45) 21-Sicronor (50) 28-Cromice (42) 35-Cromival (43)
Para se utilizar uma tabela de números aleatórios, é preciso associar cada elemento da população a
um número. Por simplicidade, será considerado números inteiros sucessivos, com a mesma quantidade de
algarismos iniciando-se por 01 (um).

Para se extrair uma amostra aleatória simples de tamanho n=5, basta tomar cinco números aleatórios
do conjunto {01, 02, ..., 35}. As empresas associadas aos nºs selecionados formarão a amostra. Neste
exemplo, suponha que foi sorteada a 1ª linha. Desprezando os valores que estiverem fora do conjunto {01,
02, ..., 35} e os valores que se repetirem, tem-se:

Números aleatórios extraídos da tabela: 08 26 24 02 04 30 09 34 07 35

Amostra da população de fornecedores:

Na prática, interessa observar certas variáveis associadas aos elementos da amostra. No exemplo em
questão, poderia se estar interessado na variável Teor de Cr 2 O 3 . Esta variável será denominada de X.
Para cada fornecedor da amostra, tem-se um valor para a variável X. O conjunto destes valores, observados
na amostra de fornecedores, é chamado de amostra aleatória simples da variável X.

Amostra aleatória simples dos fornecedores:


{Cromil, Cromiba, Incromar, Incroeste, Cromalt, Incropar, Sicroval, Sicropol, Cromax, Cromival }

Amostra aleatória simples de


X: {X1 , X2, X3, X4, X5, X6, X7, X8, X9, X10}

onde X1 representa o Teor de Cr 2 O 3 da empresa Cromil,, X2 é o teor de Teor de Cr 2 O 3 da empresa


Cromiba, etc. Ou seja:

{45, 46, 48, 46, 48, 44, 43, 48, 50, 43}

2.6.2 - AMOSTRAGEM SISTEMÁTICA


8
Muitas vezes é possível obter uma amostra de características parecidas com a amostra
aleatória simples, por um processo bem mais rápido. Por exemplo, tirar uma amostra de 1.000 fichas, dentre
uma população de 5.000 fichas, pode-se tirar, sistematicamente, uma ficha a cada cinco (5.000/1.000 = 5).
Para garantir que cada ficha da população tenha a mesma probabilidade de pertencer á amostra, a primeira
ficha deve ser sorteada, dentre as cinco primeiras.
Numa amostragem sistemática a relação N/n é chamada intervalo de seleção ou amplitude (h). No
exemplo das fichas o intervalo de seleção é 5.000/1.000 = 5. (Basicamente é feito um sistema para encontrar
valores, que permitirá ter uma amostra, tendo para todos a mesma probabilidade).

Exemplo 6 - Considere a população dos N=35 fornecedores do Exemplo 5. Realize uma amostragem
sistemática para obter uma amostra de tamanho n=5. Inicialmente, o intervalo de seleção deve ser calculado:
N/n = 35/5 ≈ 7. A seguir, um elemento deve ser sorteado dentre os seis primeiros. Suponha que o
número sorteado é o “3”, ou seja, o primeiro hotel da amostra é o “Macrosul”. Os demais são obtidos pelo
intervalo de seleção “7”(ou seja, de 7 em 7), a partir do Macrosul, resultando na seguinte amostra:

(03) (10) (17) (24) (31)


{Macrosul, Cromitax, Cromipar, Incromar, Cromisul }

2.6.3 - AMOSTRAGEM ESTRATIFICADA

A técnica de amostragem estratificada consiste em dividir a população em subgrupos, que são


denominados de estratos. Estes estratos devem ser internamente mais homogêneos do que a população toda,
com respeito às variáveis em estudo. Por exemplo, para estudar alguns parâmetros, de um conjunto de
hotéis, pode-se estratificar esta população por quantidade de estrelas, pelo tipo de acomodações (quarto,
apartamento, chalé etc), ou pela distância até o centro da cidade. Deve-se escolher um critério de
estratificação que forneça estratos bem homogêneos, com respeito ao que se está estudando. Neste contexto,
um prévio conhecimento sobre a população em estudo é fundamental.
Sobre os diversos estratos da população, são realizadas seleções aleatórias, de forma independente. A
amostra completa é obtida através da agregação das amostras de cada estrato. Ver figura 2:

Estrato 1 subgrupo 1 da amostra


seleções
Estrato 2 aleatórias subgrupo 2 da amostra Amostra
Estratificada
...
Estrato K subgrupo K da amostra
Figura 2 - O processo de amostragem estratificada.

Amostragem estratificada proporcional: neste caso particular de amostragem estratificada, a


proporcionalidade do tamanho de cada estrato da população é mantida na amostra. Por exemplo, se um
estrato corresponde a 20% do tamanho da população ele também deve corresponder a 20% da amostra. Ver
figura 3:
POPULAÇÃO: espécie da floresta.

60%
AMOSTRA: parte da comunidade da floresta
20%

20%
9
Figura 3 - Ilustração de uma amostragem estratificada proporcional.

A amostragem estratificada proporcional garante que cada elemento da população tem a mesma
probabilidade de pertencer a amostra.

Exemplo 7 – Na população do ex 5 os fornecedores estão distribuídos em região conforme mostra a tabela


abaixo:

Nordeste Cromax Cromape Cromiba Cromice Crominor Incromar Sicronor


Sudeste Cromix Incroeste Sicroeste Crominas Cromales Cromisp Sicropol
Sul Cromalt Cromil Macrosul Sicrosul Cromixel Cromales Cromipar
Cromisc Cromilpa Cromisul Incrosu Induscron Incromit Macropar
Incroval Cromitax Macroval Incrosc Sicroval Incropar Cromival
Supondo que o fornecedor possa ser relativamente homogêneo dentro de cada região, foi realizada
uma amostragem estratificada, proporcional por categoria, para obter uma amostra global de tamanho n=10.
A tabela seguinte mostra as relações de proporcionalidade.

Tabela 1. Cálculo do tamanho da amostra em cada estrato

ESTRATO Proporção na população Tamanho do subgrupo na amostra


Nordeste 7/35= 0,2 (ou 20%) n1 = (0,20).10 =2
Sudeste 7/35= 0,2 (ou 20%) n2 = (0,20).10 = 2
Sul 21/35= 0,6 (ou 60%) n3 = (0,60).10 = 6

Observação: Note que a soma dos tamanhos dos subgrupos na amostra deve ser igual ou maior ao tamanho
da amostra. Isto é, n = n1+n2+n3.

Para selecionar aleatoriamente 2 empresas do Nordeste, é preciso extrair números de dois algarismos.
Usando a própria numeração da população e iniciando pela terceira linha da tabela , tem-se: {D13, D15, D2,
D12, D14}.
Para selecionar aleatoriamente 2 empresas do Nordeste, foi utilizada a numeração já existente na
população, substituindo o “10” por “0”. Neste caso, pode-se usar a tabela de números aleatórios, tomando
valores com um algarismo. Usando, por exemplo, a primeira linha da tabela de números aleatórios( 15,
03...), os seguintes foram selecionados: {Incromar, Cromape}, correspondentes aos dois primeiros números
desta linha.
Para o Sudeste, usando a segunda linha da tabela de números aleatórios(13, 35), com o mesmo
processo de numeração, tem-se: {Cromolesp , Cromival} (sem repetição).
A amostra{ , , , , , , , , , } é uma
amostra estratificada proporcional dos fornecedores. Cada elemento desta amostra deverá ser pesquisado
para se levantar a característica de interesse, ou seja, o preço das diárias.
Desde que no problema em estudo, os estratos formam subgrupos mais homogêneos do que a
população como um todo, uma amostra estratificada proporcional tende a gerar resultados mais precisos,
quando comparada com uma amostra aleatória simples.

2.7 - FONTES DE ERROS NOS LEVANTAMENTOS POR AMOSTRAGEM


O erro amostral, definido como a diferença entre uma estatística (calculada a partir de uma amostra
de n elementos) e o verdadeiro valor do parâmetro (característica de uma população de N elementos), parte
do princípio de que as n observações que compõem a amostra são obtidas sem erro. Na prática, isso
geralmente não acontece.
Havendo erros ou desvios nos dados da própria amostra, a diferença entre a estatística e o parâmetro
pode ser maior que o limite tolerável, que será usado para o cálculo do tamanho da amostra. Por isso, o
10
planejamento e a execução da pesquisa devem ser feitos com muita cautela, para evitar ou
reduzir, os erros nos próprios dados da amostra, conhecidos como erros não amostrais.
Alguns dos erros não amostrais são:
- população acessível diferente da população alvo; - falta de resposta; - erros de mensuração.

Tabela de Números Aleatórios

3761 7597 5378 6798 8615 9303 4489 9243 2000 8475 1217 5066
1358 3568 7270 1541 3419 5807 7685 8850 3347 0296 0190 0949
3046 1336 3254 1353 4771 4656 2115 8463 4688 6778 1731 2144
7881 7802 7887 9275 7898 9064 3612 9864 2515 9822 6783 6815
4560 1367 8954 7499 3318 7650 3514 2797 8964 7000 7832 2006
9422 6350 1984 2783 0504 1217 0211 6775 3732 7025 7437 5534
0917 4455 3076 9885 2674 7129 0525 5033 6971 9722 2959 8387
1939 3487 1980 1246 0919 9046 2114 6828 6254 7151 6104 4944
2792 8042 1126 2931 8598 0394 0886 7241 5897 9979 4844 7052
2962 5542 8505 9755 6208 4944 8321 1478 0755 8057 3851 5257
9248 3467 7508 2059 2035 4727 2333 6830 4731 5753 9859 4702
0329 5334 6031 8724 0822 4450 5539 3824 0472 1070 9729 7155
5702 9657 0439 9622 6492 2872 6059 2981 4418 8179 4362 7711
2170 2085 3552 2025 6077 3025 1443 4832 7518 6816 7253 6389
0727 4568 1093 1367 9717 1076 9226 8005 3348 3065 8040 9023
3232 1415 8109 1856 5130 4493 3084 1644 8218 0273 3703 3202
3284 8703 4462 5671 6097 9548 6945 7599 3282 4457 3269 7510
0450 6876 3869 9441 8455 8960 9966 2309 0166 8482 4710 7059
6059 8911 6548 6664 2302 3914 9627 4051 9509 0484 5517 3518
6812 5772 9975 4415 1847 7677 0189 9621 6712 2467 6984 5969
9501 0236 8889 6871 0264 0098 9478 0019 1213 9797 6906 3209
8771 5073 5423 7458 5108 6573 2546 3989 9280 7907 348 5817
1696 3076 7825 0866 6535 4011 0251 230 6308 5592 1875 6828
6694 8886 9289 5263 4103 0624 2571 3820 7183 9722 9759 0653
6186 8680 5778 9560 9345 1530 8557 8569 0012 6380 5229 2048
3845 4647 8861 0800 7999 7169 8137 9655 3392 7766 5009 9377
9122 3464 6255 3801 7526 1509 4450 5206 1589 5922 5904 4117
1786 8686 9974 9919 1762 8168 6603 1364 8540 4755 6369 2415
8895 2853 7826 1711 8914 2700 9595 5709 4503 4523 4463 1686
6025 7057 5325 4437 0934 0136 2360 6381 9848 3091 3297 0015
1414 9535 1899 6682 7805 8670 5290 4220 3672 0793 3362 7761
7345 2468 7056 1429 0627 8296 1651 0136 3889 7454 9946 1957
9391 9285 7156 9795 9544 9432 4787 2072 2051 9225 2783 5076
3873 1777 9000 7722 3113 5325 4640 8932 0990 9633 3240 9406
9986 0824 1117 8433 1654 9695 4286 0747 3446 1802 0497 4123
11
LISTA-AMOSTRAGEM
1) Em cada uma das seguintes alternativas especificar o que é preferível censo(c), amostragem(a).
 população muito grande .(a)
 pesquisa com custo elevado .(a)
 pesquisa que exige precisão exata . (c)
 população pequena .(c)
 pesquisa onde os itens analisados são destruídos .(a)
 pouco espaço de tempo para a realização da pesquisa . (a)
2) Extrair uma amostra aleatória simples de n=15, da população de fornecedores de Cromita do
Exemplo 5 (usando a 2ª linha da tabela de nº aleatórios).
(13, 35, 27, 1, 15, 34, 19, 7, 3, 33, 2, 29, 9, 4, 32). (cromalesp, cromival, macropar, cromix, sicrosul,
sicropol, incruscrom, cromax, marcrosul, crominor, incroeste, cromilpa, sicroval, Cromalt, Incrosc).
3) Extrair uma amostra aleatória simples de n=15 da variável teor de Cr 2 O 3 associada à amostra de
fornecedores obtida no ex. anterior.(44, 43, 52, 46, 47, 48, 45, 50, 43, 44, 46, 47, 43, 48, 49)
4) Selecionar uma amostra estratificada proporcional de tamanho 12, da população do exemplo 5.
Cromix, incroest, incovalt, sicroest, cromil, cromixel, crominas, cromalesp, incroscrom, cromip,
cromiba, incropar, 44, 45, 46, Cr 2 O 3 .
5) Selecionar uma amostra estratificada proporcional c/ n=8 do ex. 5 da seguinte forma:

Estrato 1: Fornecedores c/ teor de Cr 2 O 3 menor de 45 12


macrosul, sicroval, crominas, cromalesp, incrosul, cromisp, incropar, crominor, cromival.
Estrato 2: Fornecedores c/ teor de Cr 2 O 3 maior de 45 e menor de 50 14
cromix, incroest, cromalt, cromixel, sicrosul, macroval, cromisc, incromar, cromiba,cromilpa, incrosc,
sicropol.
Estrato 3: Fornecedores c/ teor de Cr 2 O 3 maior ou igual a 50. 6
cromax, cromitax, sicronor, incromit, macropar.

6) Os domicílios de uma determinada zona urbana foram enumeradas de 1 a 210. Desejando-se uma
amostra sistemática de tamanho 15 dessa população de domicílios, foi sorteado o começo 9.
a) Qual o intervalo dessa amostragem?
210/15=14

b) Quais os nºs correspondentes aos domicílios que compõe essa amostra?


9, 23,37,51,65,79,93,107,121,135,139,163,177,191,205.
12
III - ESTATÍSTICA DESCRITIVA

Coletados os dados, surgem então questões do tipo: Como comunicar os dados obtidos? Como
descrever e caracterizar o conjunto de dados como um todo?
Pode-se tentar lê-los e adquirir uma idéia subjetiva da informação nele contida. Porém em muitas
situações isto não é viável devido ao grande número de dados. Além disso, uma impressão subjetiva não só é
difícil de ser transmitida como também pouco convincente. Assim, chegamos à conclusão de que são
necessárias técnicas estatísticas que reduzam e descrevam uma grande quantidade de informação.
Para condensar e comunicar os dados são usados dois esquemas: as tabelas e as representações
gráficas. Estas estratégias se direcionam de forma diferente quando se trata de dados qualitativos ou
quantitativos, conforme veremos em seguida. Além disso, os dados podem ser organizados para uma única
variável de cada vez, ou envolvendo duas ou mais variáveis.
Para caracterizar o conjunto de dados como um todo, faz-se a análise descritiva dos mesmos através
das medidas descritivas.

1 - RESUMO E APRESENTAÇÃO DE DADOS QUALITATIVOS

1.1 - TABELAS:

Ao se resumir os dados coletados, em uma tabela, algumas normas devem ser seguidas:

a)Toda tabela deve conter Título e Fonte.

Título: é a indicação que precede a tabela e que contém a designação do fato observado, o local e a
época em que foi registrado. (o quê? ; quando? ; onde? ).
Fonte: é a indicação da entidade responsável pelo fornecimento dos dados ou pela sua elaboração.

b)Outros dois elementos primordiais na tabela são: o cabeçalho e a coluna indicadora. O primeiro
evidencia o conteúdo das colunas e fica na parte superior da tabela, o segundo mostra o conteúdo das linhas.

c)Cada cruzamento entre linha e coluna é denominado célula ou casa.

d)Nenhuma célula ( casa ) deve ficar em branco.

e)Hífen ( - ) , indica que o valor numérico é nulo.

f)Reticência ( ... ) , indica que não se dispõe do dado.

g)Interrogação ( ? ) , indica dúvida quanto a exatidão do valor numérico.

h)Zeros ( 0 ; 0,0 ; 0,00 ), indica valor muito pequeno em relação a unidade utilizada.

i)A tabela não é fechada lateralmente por traços verticais.

j)Não há obrigatoriedade de linha vertical entre as colunas, mas deve ser usada quando a tabela
apresenta muita informação (muitas colunas e/ou muitas linhas).
13

1.2 -TABELA SIMPLES: É a representação dos valores de uma única variável.

Coluna OPERADORS QUE GERAM MAIS RECLAMAÇÕES


indicadora BRASIL - 2006 Título
Cabeçalho
OPERADORA ASSINANTES (em 1000)
Telemar 0,532
Embratel 0,448
Brasil Telecom 0,382
GVT 0,275
TOTAL 1,637
Fonte: Revista: info (outubro de 2006) Corpo da tabela

1.3 - TABELAS DE DUPLA ENTRADA OU DE CONTINGÊNCIA: É a representação, em uma


única tabela, de valores de mais de uma variável, isto é, a conjugação de duas tabelas simples.

INDICADORES SOCIAIS BRASILEIROS MUNDIAIS


ENTRE 2002 E 2005
INDICADORES BRASIL MUNDO
CRESCIMENTO DA 3,6 7,0
RENDA PER CAPTA
INVESTIMENTOS -9 48
ESTRANGEIROS
Fonte:: Revista Veja, novembro 2006.

2. SÉRIES ESTATÍSTICAS. Séries estatísticas, num sentido mais amplo, é um conjunto de dados
estatísticos em função da época, do local ou da espécie, que podem ser apresentados em forma de tabelas.

2.1. TIPOS DE SÉRIES ESTATÍSTICAS:

TEMPORAL - também conhecida como CRONOLÓGICA, EVOLUTIVA ou


HISTÓRICA. É a série em que os dados são observados segundo a época de ocorrência. Nesta série o fator
variável é tempo e os fixos são: local e espécie.

PROJEÇÃO DA RECOMPOSIÇÃO DO
LUCRO DOS PRODUTORES DE FRANGO
-BRASIL-2005 A 2007
ANO MARGEM DE
LUCRO %
2005 3,2
2006 -15,4
2007 3,6
Fonte: Revista Veja novembro 2006
14

GEOGRÁFICA - também denominada TERRITORIAL ou ESPACIAL. É a série em que os dados são


observados segundo a localidade de ocorrência. Nesta série o fator variável é local e os fixos são: tempo e
espécie.
Nº DE DIAS TRABALHADOS POR ANO PARA PAGAR IMPOSTO
DE RENDA 2006
PAÍS DIAS
Brasil 2191
Eua 1485
Argentina 1102
Chile 1097
Fonte: Revista Veja 2006

ESPECÍFICA - também conhecida por CATEGÓRICA. É a série em que os dados são agrupados
segundo a modalidade de ocorrência.(os dados variam em função do gênero específico em estudo). ( Todo o
resto que não seja Temporal ou Regional ).
MEDIDA DO SOM – BRASIL - 2006
TIPO DECIBÉIS

Disparo de arma de fogo 140


Britadeira 120
iPod no volume máximo 114
Violino 100
Trânsito pesado 80
Conversa normal 60
Pingos de chuva 40
Fonte: Revista info, março 2006

DISTRIBUIÇÃO DE FREQÜÊNCIA - É a série em que os dados são, agrupados segundo suas


respectivas freqüências absolutas. (a variação dos dados fica definida conforme as classes em que foram
divididos ou os valores assumidos).
Nesta série os três valores tempo, local e espécie são fixos.

TABELA 6-Teor de Cr2 O3 dos lotes de Cromita


dos fornecedores Industria X-Ano Y
TEOR Freqüência(Fi)
42|---44 4
44|---46 3
46 |--- 48 8
48 |--- 50 6
50 |--- 52 4
TOTAL 25
15
Fonte: Departamento Pessoal

3. GRÁFICOS

Os gráficos são de grande utilidade na apresentação de dados estatísticos. Os números são


considerados frios e de difícil interpretação, mas ganham vida quando são substituídos por figuras que
mostram, com uma simples olhadela, o significado global de um conjunto de dados. Os gráficos mais usados
para dados qualitativos são: Barras ou Colunas, Setor e Linha.
Assim como as tabelas, os gráficos também devem ter título e fonte.

EXEMPLOS:

3.1 - GRÁFICO EM BARRAS (OU EM COLUNAS): São empregados para representar


informações de qualquer tipo de variável, inclusive o tempo (no caso em que o número de datas não é muito
grande). (Em particular, textos que podem ser escritos à baixo da coluna, sem extrapolar o seu
comprimento).

VENDAS DA INDUSTRIA X NO ANO Y

45%
40%
35%
30%
25%
20%
15%
10%
5%
0%
1º 2º 3º 4º

TRIMESTRE

Fonte: Elementary Statistivs, second edition-2003

3.2. GRÁFICO EM SETORES: Aplicável quando as categorias básicas são quantificáveis.


Toma-se um círculo (360 graus), que é dividido em setores com áreas proporcionais às freqüências das
diversas categorias. (Não se deve utilizá-lo quando tiver valores negativos).
16

EXPORTAÇÕES BRASILEIRA
JAN/AGO - Ano X
DEMAIS
19%

ASIA
22% EUA+CANAD
A
21%

ALADI
29%
Fonte: FUNEX (FOL. S.P).
Fonte: Almanaque. Abril Ano X.

3.3. GRÁFICO EM LINHA: É um dos mais importantes gráficos; representa observações feitas ao
longo do tempo, em intervalos iguais ou não. Tais conjuntos de dados constituem as chamadas séries
históricas, ou séries temporais. Traduzem o comportamento de um fenômeno em certo intervalo de tempo.
(Utilizado para grandes quantidades de dados).
90000

80000 GOLPES CIBERNÉTICOS - BRASIL


1999-2006
70000

60000

50000

40000

30000

20000

10000

0
1999 2000 2001 2002 2003 2004 2005 2006
Fonte: Cert.br Centro de Estudos, resposta e Tratamento de Incidentes de Segurança no Br)
3.4. GRÁFICO COMPARATIVO: É um gráfico utilizado quando se deseja comparar variáveis.
(Também quando utiliza-se nomes muito grandes, textos em geral).

SERVIÇOS DE ACESSO MAIS VELOZES - 2006

Japão

EUA
reais
Mbps
Coréia do Sul

Alemanha

0 50 100 150 200


Fonte: Revista info out 2006
17

4 – RESUMO E APRESENTAÇÃO DE DADOS QUANTITATIVOS

Quando nos é proposta a análise de um conjunto de dados sem características de séries cronológicas,
geográficas ou específicas, o tratamento descritivo desses dados estatísticos deve iniciar-se por um processo
de sintetização. A sintetização dos dados poderá ser feita, adotando-se algum critério de classificação
(subconjuntos), que permita apresentar os dados em tabelas, de forma resumida. Tais tabelas são chamadas
DISTRIBUIÇÃO DE FREQÜÊNCIAS.

4.1. CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA DISCRETA

Para o desenvolvimento desse item, utilizaremos um exemplo.

EXEMPLO 1. Tempo, em segundos, entre carros que passam por um cruzamento de Maringá em 02/98,
viajando na mesma direção:
6 3 5 6 4 3 5 4
4 2 3 2 5 4 3 4
Os dados foram obtidos pelo Departamento de Trânsito de Maringá.

DADOS BRUTOS ( Xi ): É o conjunto de dados numéricos obtidos após a crítica dos valores coletados,
como acima.
Representação: - x1,...,xn ( se amostrais )
- x1,...,xN (se populacionais )
ROL: É o arranjo dos dados brutos em ordem crescente ou decrescente. O rol em geral, por ser trabalhoso
em sua elaboração, pode ser dispensado.

Organizando os dados brutos do exemplo 1 em ROL CRESCENTE obtemos:

ROL: 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 6, 6.

FREQÜÊNCIA ABSOLUTA (Fi): É o número de vezes que um valor Xi aparece no conjunto de dados.

FREQÜÊNCIAS ABSOLUTAS ACUMULADAS ( Fai ): Consiste em acumular o número vezes que um


dado Xi aparece no conjunto de dados acrescido da frequência absoluta dos Xi's anteriores.
No exemplo 1, a distribuição de freqüência será:
18
TEMPO, EM SEGUNDOS, ENTRE CARROS QUE PASSAM
POR UM CRUZAMENTO DE MARINGÁ- 02/98
TEMPO (Segundos) Fi Fai
2 2 2
3 4 6
4 5 11
5 3 14
6 2 16
TOTAL 16
Fonte: Departamento de Trânsito.

OBS: Na tabela acima, a coluna dos Fai's é uma coluna complementar da distribuição de frequência.
Veremos no exemplo a seguir uma distribuição de frequência completa.

GRÁFICO EM BASTÃO (ou em Colunas): Utilizado quando os dados consistem em


contagens e não de mensurações em escala contínua . Os valores distintos Xi's são locados no eixo
horizontal, e em cada um deles traça-se um segmento vertical de altura proporcional à respectiva frequência.
TEMPO, EM SEGUNDOS, ENTRE CARROS QUE PASSAM
POR UM CRUZAMENTO DE MARINGÁ - 23/12/97
6

4
Nº DE CARROS

0
2 3 4 5 6

Fonte: Departamento de Trânsito. TEMPO

4.2. AGRUPAMENTO DOS DADOS – DISTRIBUIÇÃO DE FREQÜÊNCIAS

Um grande conjunto de dados quantitativos necessita de um método eficiente de agrupamento ou de


sumarização, de forma que seu manuseio, visualização e compreensão sejam simplificados. Para isto, os
dados devem ser agrupados em classes.

EXEMPLO 2: Considere uma amostra de 25 indústrias, da variável número de funcionários de indústrias


Químicas no Paraná em 31/01/2000. Suponha os dados fictícios.

46 47 51 47 43 47 43 44 51 49
48 43 48 46 42 49 46 45 46 44
46 49 51 48 50

Os dados, como apresentados acima, são chamados brutos, pois não foram ainda submetidos a
nenhum tipo de tratamento.

Inicialmente, os dados devem ser colocados em ordem crescente:


42 43 43 43 44 44 45 46 46 46
46 46 47 47 47 48 48 48 49 49
19
49 50 51 51 51

Pode-se observar agora que das 25 observações o menor valor é 42 e o maior é 51.

Amplitude (AT): é a diferença entre o maior e o menor valor do conjunto de dados observados.
Para os dados acima: AT = 51-42 = 9.

Observe que esse exemplo contém um número pequeno de observações (n=25), quando há um grande
número de dados observados o processo de ordenação é trabalhoso e a listagem final pouco representará.
Nesses casos, pode-se simplificar o processo agrupando os dados em certo número de classes, cujos limites
serão denominados limite inferior e limite superior.

A quantidade de classes e a amplitude destas devem ser obtidas observando as seguintes normas:
i)as classes devem cobrir a amplitude total;
ii)o extremo superior de uma classe é o extremo inferior da classe seguinte;
iii)cada valor observado deve enquadrar-se em apenas uma classe;
iv)o número total de classes não deve ser inferior a 5 e nem superior a 25;
O número de classes, (k), pode ser obtido de uma das fórmulas seguintes:
i) k = n ;
ii) k = 1 + 3,22 log n, (fórmula de Sturges).

Para o conjunto de dados do exemplo: k = 25 = 5 ou k = 1 +3,22log(25) = 5,61.

Não é obrigatório o uso de qualquer dessas fórmulas. O número de classes pode ser estabelecido pelo
bom senso de quem vai construir a tabela.

Dividindo a amplitude total (AT) por 5 chega-se ao tamanho ou amplitude de cada uma das classes:
AT 9
h= = = 1,8 ≅ 2.
k 5
Observação: quando os valores observados são números inteiros, os limites das classes também
devem ser números inteiros. Para isso, aconselha-se escolher o número mais próximo de AT que resulte h =
AT
em um número inteiro.
k

Agora, utilizando esse valor pode-se obter os limites inferiores e superiores das classes:
i)o limite inferior da primeira classe é o menor valor da série;
ii)os demais limites serão obtidos somando aos limites inferiores o valor de h. Isto é,

42 |----- 42+h = 42 + 2=44


44 |----- 44+h = 46
46 |----- 46+h = 48
48 |----- 48+h = 50
50 |----- 50+h = 52.

Observe que a notação (|-----) significa que se está incluindo os valores iguais ao limite inferior e
excluindo os valores iguais ou superiores ao limite superior.
A partir da listagem ordenada das classes, pode-se construir os chamados quadros (ou tabelas) de
freqüência ou distribuições de freqüência, que permitem uma melhor visualização dos dados.

Freqüência: é o número de valores que aparecem no domínio de uma classe.

4.2.1 – CONSTRUÇÃO DE DISTRIBUIÇÃO DE FREQÜÊNCIA CONTÍNUA


20
Utilizando os limites de classes obtidos acima para o exemplo, tabela abaixo:

Tabela 1 – Número de funcionários da Indústria Mecânica X no Paraná em 31/01/2000


Classes Freqüência (Fi)
42 |----- 44 4
44 |----- 46 3
46 |----- 48 8
48 |----- 50 6
50 |----- 52 4
TOTAL 25
Fonte: Dados hipotéticos

Um quadro de freqüências completo deve conter as seguintes informações:


i) xi é o ponto médio da i-ésima classe; representa a média dos pontos limites da classe;
ii) n é o tamanho da amostra;
iii) ni é o número de observações, ou a freqüência, da i-ésima classe;
iv) Fi é a freqüência absoluta da i-ésima classe;
F
v) fi é a freqüência relativa da i-ésima classe, fi = i ;
n
vi) Fac é a freqüência acumulada;
F
vii) fac é a freqüência relativa acumulada, fac = ac .
n

Tabela 2 –Número de funcionários da Construção Civil X no Paraná em 31/01/2004


Classes xi Fi fi Fac fac
42 |----- 44 43 4 0,16 4 0,16
44 |----- 46 45 3 0,12 7 0,28
46 |----- 48 47 8 0,32 15 0,60
48 |----- 50 49 6 0,24 21 0,84
50 |----- 52 51 4 0,16 25 1
Total 25 1
Fonte: Dados hipotéticos

4.3. GRÁFICOS
Os principais gráficos utilizados na representação de distribuição de freqüências são:
i) histograma e polígono de freqüência;
ii) ogiva ou polígono de freqüência acumulada.

4.3.1. HISTOGRAMAS: é um conjunto de retângulos com bases sobre um eixo dividido de acordo
com os tamanhos de classe, centro nos pontos médio das classes e áreas
proporcionais às freqüências.
21

Nº DE FUNCIONÁRIOS DE UMA
CONSTRUTORA EM CURITIBA 31/01/04
9
8
7
Nº de empresas 6
5
4
3
2
1
0
42 44 46 48 50 52
Nº de funcionários

Fonte: Dados hipotéticos

4.3.2. POLÍGONOS DE FREQÜÊNCIAS: é um gráfico que se obtém unindo por uma poligonal os
pontos correspondentes às freqüências das diversas classes, centradas nos respectivos pontos médios (xi ).
Para obter as interseções do polígono com o eixo, cria-se em cada extremo do histograma uma classe com
freqüência nula.

NÚMERO DE FUNCIONÁRIOS DE UMA


CONSTRUTORA EM CURITIBA - 31/01/04
9
8
7
Nº de empresas

6
5
4
3
2
1
0
39 41 43 45 47 49 51 53 55
Nº de funcionários

Fonte: Dados hipotéticos

OBS: Suavizando a linha poligonal que define o polígono obtém-se uma curva que visualiza a
tendência de variação dos dados.

4.3.4. POLÍGONOS DE FREQÜÊNCIA ACUMULADA OU OGIVAS: é o gráfico representativo


de uma distribuição acumulada de freqüências. É uma poligonal ascendente. No eixo horizontal colocam-se
as extremidades de classe e no eixo vertical as freqüências acumuladas.
Note que a freqüência acumulada relacionada com o limite inferior da primeira classe é sempre zero.
Ao contrário do polígono de freqüência, a ogiva de freqüências acumuladas utiliza os pontos
extremos
22

NÚMERO DE FUNCIONÁRIOS DE UMA


COSTRUTORA EM CURITIBA - 31/01/05
30

25
Nº de empresas
20

15

10

0
40 42 44 46 48 50 52
Nº de funcionários
.
Fonte: Dados hipotéticos

Exercício: Construir os gráficos p/ Teor de Cr2O3 dos lotes de Cromita dos fornecedores da Indústria X-
1998.

5 - MEDIDAS DESCRITIVAS

EXEMPLO 3: Em uma amostra de 5 supermercados de Maringá foi pesquisado o preço de macarrão


(pacote com 500 grs), que é um dos produtos da cesta básica. Os dados foram obtidos de O Jornal do povo
de 06/02/00 e se referem ao produto com o menor preço, independente de marca ou qualidade.
0,95 0,78 0,75 0,65 0,80

5.1 - MEDIDAS DE TENDÊNCIA CENTRAL OU DE POSIÇÃO: São medidas que objetivam


representar o ponto central de equilíbrio de uma distribuição de dados. Essas medidas representam
quantitativamente os dados, sendo as mais utilizadas em análise:

5.1.1 - Média: Representa o ponto de equilíbrio de um conjunto de dados. Seja ( x1,...,xn ) um conjunto de
dados. A média é dada por:

µ=
∑ x i ( dados populacionais ), para dados não-agrupados
N

X=
∑ xi ( dados amostrais )
n
∑ x i Fi
X= , para dados agrupados em tabelas de freqüências.
∑ Fi

Quando os dados são agrupados em intervalos de classes, xi corresponde ao ponto médio do intervalo.
Propriedades da média:
1 - A soma algébrica dos desvios tomados em relação a média é nula. Isto é,
k

∑ di =0
i =1

onde di = xi - x , i = 1, 2, ..., n e x é a média do conjunto de dados.

2 - Somando-se ou subtraindo-se uma constante, k, a todos os valores de uma variável, a média do conjunto
fica aumentada ou diminuída dessa constante.
23

yi = xi ± k ⇒ y = x ±k

3 - Multiplicando-se ou dividindo-se todos os valores de uma variável por uma constante, k, a média do
conjunto fica multiplicada ou dividida por essa constante.
x x
yi = xi . k ⇒ y = x . k e y i = i ⇒ y = .
k k

Vantagens e desvantagens da média:


1- É uma medida que, pôr uniformizar os dados, não representa bem os conjuntos que revelam
tendências extremas, uma vez que a mesma será grandemente influenciada pôr valores discrepantes.
Suponha por exemplo, que durante um ano letivo, um aluno as seguintes notas em uma disciplina: 30,
35, 25, 30, 25, 35, 35, 95, 90, 100.
Um cálculo rápido nos mostra que sua média final foi 50. Como a média final deve traduzir o
aproveitamento do aluno durante o ano e a média 50 só foi conseguida à custa das três últimas notas,
concluímos que 50 é um valor falho para medir o aproveitamento do aluno.
2- A média nem sempre tem existência real, isto é, ela nem sempre faz parte do conjunto de dados.
3- É a medida de posição mais conhecida e de maior emprego.
4- É facilmente calculada.
5- Serve para compararmos conjuntos semelhantes.
6- Depende de todos os valores do conjunto de dados.
7- Em geral não ocupa a posição central do conjunto (ocupa a posição do centro de equilíbrio).

No exemplo 1 : x = 3,94 seg., ou seja, a média de tempo entre os carros que passam por um cruzamento de
ruas de Maringá é de 3,94 segundos.
No exemplo 2 : x = 47,24 funcionários.
Comentário: A média de funcionários das empresas têxteis é de 47,24 funcionários.

No exemplo 3(dados não agrupados): x = 0,786 reais.


Comentário: A média de preço do macarrão foi de 0,786 reais.

Exercício1: a)Calcule a média do conjunto de dados: 27, 45, 86, 54, 26, 100, 54, 48, 39..53.22

5.1.2 - Moda ( Mo ): É o valor que ocorre com maior freqüência em uma série de dados.
Existem séries de dados em que nenhum valor aparece mais vezes que outros. Neste caso não
apresenta moda. São séries amodais.
Em outros casos, pode aparecer dois ou mais valores de concentração. Diz-se, então, que a série tem
duas ou mais modas (bimodal, trimodal).
Quando os dados se apresentam agrupados em tabelas de freqüências é necessário utilizar a
expressão de Czuber , dada abaixo, para calcular o valor que representa a moda:

h.( Fi − Fi −1 )
Mo = li + (onde i é a ordem da classe de maior freqüência )
( Fi − Fi − 1 ) + ( Fi − Fi + 1 )
Pode-se também, neste caso, tomar o ponto médio da classe modal como sendo a moda

No exemplo 1 : Mo= 4 segundos.


Comentário: O tempo mais frequente entre os carros que passam por um cruzamento de ruas
de Maringá é de 4 segundos.

No exemplo 2 : Mo= 47,42 funcionários.


Comentário: O número de funcionários mais frequente entre as empresas é de 47,42
funcionários.
24
No exemplo 3: O conjunto de dados é amodal pois não ocorreu preço repetido.

5.1.3 - Mediana ( Md ): A mediana de um conjunto de valores ordenados segundo uma ordem de grandeza,
é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de
elementos.
Quando o conjunto de observações tem um número ímpar de valores, não-agrupados em classes,
então a mediana é dada pela expressão:
n +1
Md = xp onde p =
2
Quando o conjunto de observações tem um número par de valores, não-agrupados em classes,
então a mediana será, a média aritmética dos dois números que ocuparem o meio da série:
x p + x p +1 n
Md = onde p = .
2 2
Quando o conjunto de observações se apresenta agrupados em classes em uma tabela de
freqüências, então a mediana é dada pela expressão:
h.( p − Fa i − 1 ) n
Md = li + onde p =
Fi 2

Vantagens e desvantagens da mediana:


1- Não depende de todos os valores da série, podendo mesmo não se alterar com a modificação de alguns
deles.
2- Não é influenciada por valores discrepantes.

No exemplo1: Md= 4 segundos.


Comentário: 50% dos tempos entre os carros que passam por um cruzamento de ruas de
Maringá estão abaixo de 4 segundos.
No exemplo2: Md= 47,38 funcionários.
Comentário: 50% do número de funcionários das empresas estão abaixo de 47,38
funcionários.
No exemplo3: Md= 0,78 reais.
Comentário: 50% dos preços estiveram abaixo de 0,78 reais.

5.2 - MEDIDAS DE DISPERSÃO: São medidas estatísticas que indicam o grau de dispersão, ou
variabilidade do conjunto de observações pesquisados, em relação a uma medida de tendência central. Elas
descrevem os dados qualitativamente
Uma única medida não é suficiente para descrever de modo satisfatório um conjunto de observações.
Por exemplo, dois conjuntos de dados podem ter a mesma média aritmética e, no entanto, a dispersão de um
pode ser muito maior que a dispersão do outro.
As principais medidas de dispersão são: amplitude total, variância, desvio-padrão e coeficiente de
variação.

5.2.1 - Amplitude total ( AT ): É a diferença entre o maior e o menor valor observado

AT = x (máximo) - x ( mínimo ), para valores não agrupados,

AT = L(max) - l(min) para valores agrupados em classes em uma tabela de freqüências,


onde L é o limite superior da última classe da tabela de freqüências
l é o limite inferior da primeira classe da tabela de freqüências.
25
5.2.2 - Variância: É a medida que fornece o grau de dispersão, ou variabilidade dos valores do
conjunto de observações em torno da média. Ela é calculada tomando-se a média dos quadrados dos desvios
em relação à média:

∑ (x − µ)
2

σ =
2 i
para valores populacionais não agrupados,
N

∑ (x )
2
i −x
2
s = para valores amostrais não agrupados,
n−1

∑ (x − µ ) Fi
2

σ =
2 i
para valores populacionais agrupados em classes em uma
N
tabela de freqüências,
∑ (x )
2
i − x Fi
s2 = para dados amostrais agrupados em classes em uma tabela
n−1
de freqüências.

No exemplo1: s2=1,54.
No exemplo2: s2=6,77.
No exemplo3: s2=0,01.

5.2.3 - Desvio-padrão. Como a variância é calculada a partir do quadrado dos desvios, sua unidade é
quadrada em relação à variável estudada, o que, sob o ponto de vista prático é um inconveniente. Por isso
mesmo, imaginou-se uma nova medida que tem utilidade e interpretação prática, denominada desvio
padrão, definida como a raiz quadrada da variância e representada por:
s= s2 σ = σ2 .
No exemplo1: s = 1,24.
No exemplo2: s = 2,60.
No exemplo3: s = 0,12.

5.2.4 - Coeficiente de variação. É uma medida relativa da dispersão ou variabilidade dos dados:

σ s
cv = ⋅ 100 ou cv = ⋅ 100
µ x

Já foi visto que o desvio-padrão tem a mesma unidade de medida que os dados, de modo que o coeficiente
de variação é adimensional.

Critérios para interpretação. Quanto menor for o coeficiente de variação, melhor será a representatividade
da média no conjunto de dados.
Se 0%≤ cv%<30%, conclui-se pela baixa variabilidade dos dados e a média é uma ótima
medida para representar os dados
Se 30%≤ cv%<50% , conclui-se pela média variabilidade dos dados e a média é uma boa
medida para representar os dados
Se cv%≥50% , conclui-se pela alta variabilidade dos dados e a média não é uma medida
apropriada para representar os dados. Neste caso, deve-se pensar na mediana
ou moda.

No exemplo1: cv% = 31,47%.


26
Comentário: A média do tempo é uma boa medida para representar todos os tempos
entre carros que passam por um cruzamento de Maringá.

No exemplo2: cv% = 5,51%.


Comentário: A média de funcionários é uma ótima medida para representar todos os números
de funcionários das empresas.

No exemplo3: cv% = 13,78%.


Comentário: A média de preço do macarrão é uma ótima medida para representar o conjunto
de todos os preços de macarrão.

LISTA DE ESTATÍSTICA DESCRITIVA

1)Assinalar a coluna a direita de acordo com a coluna a esquerda.


( 1 ) Parâmetro ( 1 ) Medidas Populacionais
( 2 ) População ( 5 ) Coleta de dados de todos os elementos da população
( 3 )Amostra ( 4 ) Medidas Amostrais
( 4 ) Estatísticas ( 2 ) Todo conjunto de indivíduos ou objetos que possuam ao
( 5 ) Censo menos uma característica comum
( 3 ) Parte da População selecionada de acordo com certas
regras

2) Indicar se a variável é qualitativa ( Qual), quantitativa discreta ( QtD) ou quantitativa contínua(QtC)


 Altura, qct
 Grau de Escolaridade, qtd
 Esporte praticado, qal
 Nº de vizinhos, qtd
 Cor de Olhos, qal
 Nº de dependências em 2008. qtd
 Peso, qtc
3) Na 1ª classe de uma distribuição de freqüências deve conter:
 terminar c/ o menor valor do conjunto de dados
 incluir o menor valor do conjunto de dados
 iniciar com o menor valor do conjunto de dados

4).Na série: 215, 62, 33, 12, 9, 5, 1, o valor 12 representa:


 mediana.
 moda
 média
5) Na série: 215, 62, 61, 33, 33, 12, 9,9, 5, 1. qual nº será:
Mediana:12,33
Moda:1,5,9,9,12,33,33,61,62,215
Média:44
27
6). Os valores a seguir correspondem ao custo médio da Construção Civil (R$/m2 ) em 2003 nas
Regiões Norte, Nordeste, Sudeste, Sul, Centro-Oeste :

Regiões Norte Nordeste Sudeste Sul Centro-Oeste


Custo Médio 435,93 404,50 483,94 462,24 437,53
Fonte: SINAPI: Sistema Nacional de Custos e Índices da Construção Civil
a) Calcular as medidas de posição. Media: 444.828, Mediana: 444.22, Moda:Ñ.
b) Calcular as medidas de dispersão. Pop: 26.8, Amost: 29.97.

Com os dados dos Exs. 7, 8 e 9:


a) Construir a distribuição que melhor represente os dados.
b) Grafar esta distribuição.
c) Calcular as medidas descritivas de posição e dispersão.
d) A média é homogênea? Justificar a sua resposta.

7. Os dados a seguir representam o rendimento de 50 bateladas consecutivas de um substrato de


cerâmica, no qual um revestimento de metal foi aplicado por um processo de decomposição a vapor
(Montgomery, 2003).
94,1 93,2 90,6 91,4 88,2 86,1 95,1 90,0 92,4 87,3 86,6 91,2 86,1 90,4 89,1 87,3 84,1 90,1
95,2 86,1 94,3 93,2 86,7 83 95,3 94,1 97,0 97,8 93,1 86,4 87,6 91,1 94,7 96,3 94,6 93,1 90,3
89,6 78,3 84,9 85,0 86,4 88,2 96,4 92,1 84,1 88,8 86,4 85,1 84,0.

8. A CIPA de uma Industria registrou o seguinte nº de acidentes de trabalho nos últimos 12 meses.

7 9 5 5 7 7 2 1 5 2 5 5

9. As variações porcentuais (mensal) do indicador de custo médio da construção civil em novembro de


2003 fornecido pela Sinapi na Revista CONSTRUÇÃO referente a 1m2 em várias cidades brasileiras
estão a seguir:
14,57; 16,76; 18,04; 12,80; 12,65; 14,43; 11,86; 17,20; 18,83; 20,09; 14,63; 16,73; 17,40; 15,33; 14,41;
21,33; 16,72; 16,88; 22,98; 21,1,; 19,7; 16,47; 21,47; 18,77; 22,27; 15,41; 18,15; 18,04.

10. Construir os gráficos e calcular as medidas descritivas de posição e de dispersão p/ a distribuição de


freqüências abaixo:

RESISTÊNCIA À COMPRESSÃO DE 80 CORPOS DE PROVA DA LIGA


DE ALUMÍNIO-LÍTIO – 2003.
2
M Quantidade
70 |-- 90 2
90 |-- 110 3
110 |-- 130 6
130 |-- 150 14
150 |-- 170 22
170 |-- 190 17
190|-- 210 10
210|--230 4
230|--250 2
∑ 144
Fonte: Montgomery, 2003
28
III - NOÇÕES DE PROBABILIDADE

1-INTRODUÇÃO

A estatística teve por função em suas origens, principalmente a organização e a apresentação de


dados coletados empiricamente.
O desenvolvimento da teoria das probabilidades permitiu, entretanto, a criação de técnicas mais
adequadas de amostragem e formas de relacionar as amostras e as populações de onde provieram essas
amostras.
Nos tópicos estudados nas aulas anteriores, foi visto que a distribuição das freqüências das
observações de um fenômeno é recurso poderoso para entender a variabilidade do mesmo. Com a teoria da
probabilidade pode-se criar um modelo teórico que reproduza muito bem a distribuição das freqüências
quando o fenômeno é observado diretamente. Tais modelos são chamados modelos de probabilidades ou
distribuições de probabilidades e são consideradas a espinha dorsal da teoria estatística, pois todos os
processos inferências são aplicações de tais modelos ou distribuições.

Exemplo 1. Deseja-se estudar as proporções de ocorrência das faces de um dado. O procedimento


prático seria lançar um dado certo número n de vezes e contar o número ni de vezes que ocorre a face i, i=1,
2,..., 6. As proporções ni/n determinam a distribuição de freqüências do fenômeno.

Outra maneira de construir a distribuição de freqüências é através das suposições teóricas. A primeira
suposição é que só podem ocorrer 6 faces; a segunda suposição é admitir que o dado é perfeitamente
equilibrado. Nestas condições, com as suposições feitas, têm-se o seguinte modelo teórico de freqüências
para as faces dos dados:

Face 1 2 3 4 5 6 Total
Freqüência teórica 1/6 1/6 1/6 1/6 1/6 1/6 6/6=1

Desse exemplo, pode-se observar que todo experimento ou fenômeno que envolve um elemento
casual terá um modelo probabilístico.
Antes de estudarmos mais especificamente estes modelos vejamos alguns conceitos fundamentais
para tais estudos.

1.2) Experimentos probabilísticos: São os experimentos cujos resultados podem não ser os
mesmos, ainda que sejam repetidos sob condições idênticas. Por exemplo:
a)- Jogar um dado e observar o número mostrado na face de cima
b)-Jogar uma moeda 8 vezes e observar o número de caras obtido
c)- Contar o número de peças defeituosas produzidas num período de 24hs em uma linha de
produção.
d)- Peças são produzidas até que 10 peças perfeitas sejam fabricadas. Contar o número de peças
fabricado.
e)-Jogar duas moedas e observar o resultado
f)-Retirar uma lâmpada de um lote e medir seu tempo de vida antes que se queime.

1.3) Espaço amostral: É o conjunto de todos os resultados possíveis de um experimento e é


geralmente representado por S
29
Exemplo 2: Para os experimentos exemplificados acima, teremos, respectivamente, os
seguintes espaços amostrais:
a) S={1,2,3,4,5,6}
b) S={0,1,2,3,...,8}
c) S={0,1,2,3...,n}, onde n é o número máximo de peças por dia.
d) S={10,11,12,...}
e) S={cc,ck,kc,kk}, onde C=cara e K=coroa
f) S={t;t≥0}, conjunto dos números reais não negativos
Obs.: - Os espaços amostrais podem ser numéricos ou não, finitos ou infinitos.
-Para um mesmo experimento pode-se ter vários espaços amostrais, dependendo do objetivo do
problema.

1.4) Eventos: É qualquer subconjunto de resultados possíveis, ou seja, qualquer subconjunto do


espaço amostral. Assim, o próprio S é um evento, chamado evento certo e o conjunto vazio também é um
evento, chamado evento impossível.

Exemplo 3: Considerando o lançamento de um dado, pode-se ter interesse, por exemplo, nos
seguintes eventos:
-Ocorrência de um número par, ou seja: A={2,4,6}
-Ocorrência de um número menor que 4, ou seja: B={1,2,3}
-Ocorrência de um número maior que 6, ou seja: C=∅ (conjunto vazio)

Propriedades dos eventos: Seja S um espaço amostral e sejam A e B subconjuntos ou eventos de S.


Assim teremos:
a) A ∪ B ocorre quando pelo menos um dos eventos ocorre, ou seja, quando ou A, ou B, ou ambos
ocorrem.
b) A ∩ B ocorre quando A e B ocorrem simultaneamente.
c) A é o complementar do evento A, ou seja, A ∪ A = S. É o evento que ocorre se A não ocorre.
d) Se A ∩ B=∅ , ou seja, se A e B não têm elementos comuns, então A e B são mutuamente
excludentes, exclusivos ou disjuntos.

1.5) Probabilidade: A cada evento A associado a um espaço amostral S, associamos um número real
P(A) denominado probabilidade de A, tal que:
0≤P(A)≤1
P(S)=1

Esta definição não nos diz como calcular P(A). Apenas nos dá algumas propriedades gerais que P(A)
deve ter. Antes de aprendermos como calcular P(A), vamos enunciar mais algumas propriedades decorrentes
destas propriedades mais gerais:

Propriedades relacionadas às probabilidades:


a) P(∅)=0
b)P( A )=1-P(A)
c)P(A∪B)=P(A)+P(B)-P(A∩B). Se A e B forem mutuamente excludentes então
P( A ∪ B) = P( A ) + P(B)
d)Se S for finito, então a soma das probabilidades de todos os resultados possíveis é igual a 1.
e) P( A ∪ B ) = P( A ∩ B) = 1 − P( A ∩ B) e P( A ∩ B ) = P( A ∪ B) = 1 − P( A ∪ B)

1.6) Resultados igualmente prováveis: A hipótese mais comumente feita para espaços amostrais
finitos é a de que todos os resultados sejam igualmente prováveis. Tais espaços são chamados equiprováveis.
Consideremos então um espaço equiprovável S e seja A⊆S um evento qualquer. Então a
probabilidade de A ocorrer será dada por:
30
P(A)= n(A)/n(S)

onde n(A), é o número de elementos de A e n(S) é o número de elementos de S

É muito importante compreender que a expressão acima é apenas uma conseqüência da suposição de
que todos os resultados sejam igualmente prováveis e ela é somente aplicável quando essa suposição for
atendida.

Exemplo 4: Um dado é lançado. Seja A o evento que ocorrerá se, e somente se, um número maior
que 4 aparecer, isto é, A={5,6}. Conseqüentemente, P(A)=2/6 já que S={1,2,3,4,5,6}.

Exercício: Seja E o experimento lançar dois dados e seja S o espaço amostral associado a E.
Considerando os eventos a seguir, calcule a probabilidade de ocorrência de cada um deles.
A={(x,y)∈S / x+y=10} ; B={(x,y)∈S / x>y} ; C={(x,y)∈S / x=2y}

O método para determinar probabilidades visto até aqui, está limitado, como sabemos, às situações
em que os resultados são igualmente prováveis. Uma forma de lidar com situações onde isto não ocorre, é
obter alguns dados empíricos, numa tentativa de estimar as probabilidades.
Para isso, muitas vezes usamos o conceito de freqüência relativa como estimativa de probabilidade da
seguinte forma:
Seja E um experimento e A um evento. Se após n realizações do experimento E, com n
suficientemente grande, forem observados x resultados favoráveis a A, então um estimativa da probabilidade
P(A), é dada pela freqüência relativa fA=x/n. Esta definição é muitas vezes chamada de probabilidade
empírica e tem por base o princípio estatístico da regularidade, isto é, à medida que o número de repetições
do experimento cresce, a freqüência relativa, fA=x/n , se aproxima da probabilidade P(A).

Exemplo 5: Em 660 lançamentos de uma moeda, foram observados 310 caras. Assim, usando a
freqüência relativa como estimativa, a probabilidade de obter-se coroa no lançamento desta moeda, será
P(A)=350/660=0,53 , onde A={aparece coroa}

É muito importante saber que fA e P(A) não são a mesma coisa, que nós apenas utilizaremos fA para
aproximar P(A), ou seja, se nós identificarmos fA com P(A), deveremos compreender que estaremos tão
somente substituindo o valor de P(A) por uma aproximação obtida experimentalmente.

Exemplo 6: Numa sala de aula com 18 meninas e 18 meninos, constatou-se que 10 meninos e 12
meninas têm olhos claros. Escolhendo-se ao acaso um dos alunos da turma, qual a probabilidade desse
elemento ser menina ou ter olhos claros?

Caracterizando os eventos do problema temos:


A={o elemento escolhido é menina}
B={o elemento escolhido tem olhos claros}
A∪B={o elemento escolhido é menina ou tem olhos claros)

Assim, como A e B não são mutuamente excludentes, segue que:


P(A∪B)=P(A)+P(B)-P(A∩B)=(18/36)+(22/36)-(12/36)=7/9

Note que, A∩B={o elemento escolhido é menina com olhos claros}


31

Exemplo 7: Considere os dados a seguir

SEXO
CURSO Masculino Feminino TOTAL
Eng. Civil 70 40 110
Eng. Química 10 40 50
Farm. Bioquímica 20 20 40
Medicina 20 10 30
TOTAL 120 110 230

Sejam os eventos: A={aluno de Eng. Civil}


B={aluno de Eng.Química}
C={aluno de Farm. Bioquímica}
D={aluno de Medicina}
M={aluno do sexo masculino}
F={aluno do sexo feminino}

Considerando agora o sorteio de um destes alunos e usando a freqüência relativa como aproximação
da probabilidade, teremos:
P(A)=110/230 ; P(B)=50/230 ; P(C)=40/230 ; ...
P(C∪D)=P(C)+P(D)=70/30 , uma vez que C e D são mutuamente excludentes
P(C∩M)=20/230 ; P(A∩F)=40/230 ; ...
P(B∪M)=P(B)=P(M)-P(B∩M)=50/230+120/230-10/230=160/230, uma vez que B e M não são
mutuamente excludentes.

1.7) Probabilidade condicional: Se A e B são dois eventos quaisquer de um espaço amostral S,


então a probabilidade condicional do evento B dado o evento A será:

P(B/A) = P(A∩B)/P(A)

Exemplo 8: Para os dados do exemplo 7, podemos agora calcular a probabilidade do estudante


sorteado ser mulher sabendo que está matriculado no curso de Eng. civil, da seguinte forma:
P(F/A)=P(F∩A)/P(A)=(40/230)/(110/230)=40/110
Ou ainda podemos calcular a probabilidade do aluno ser de Engenharia civil sabendo que é homem:
P(A/M)= P(M∩A)/P(M)=(70/230)/(120/230)=70/120

Da definição de probabilidade condicional obtemos a regra do produto das probabilidades:

P(A∩B)=P(B)P(A/B) ou P(A∩B)=P(A)P(B/A)

1.8) Independência: Um caso muito importante da regra do produto, ocorre quando os eventos são
independentes, pois se A e B são independentes então P(A/B)=P(A). Assim, se A e B são independentes, da
regra do produto temos:

P(A∩B)=P(A)P(B)
32
Exemplo 9: Considere uma urna com duas bolas brancas e três bolas pretas. Extrair
casualmente duas bolas, sendo uma após a outra, tal que a primeira bola é reposta antes de se extrair a
segunda. Obtenha a probabilidade dos seguintes eventos:
A={as duas bolas são brancas} B={a primeira é branca e a segunda é preta
C={a primeira é preta e a segunda é branca} D={nenhuma bola é branca}

3/5 P P(A) =2/5.2/5=


P B
2/5

3/5 P
B B
2/5
Exemplo 10: Suponha que a extração seja sem reposição.

LISTA DE PROBABILIDADE

1) Em uma Universidade foram examinados 1204 universitários acima de 17 anos para verificar se o curso
que faziam é o que realmente queriam cursar.

SEXO CURSO TOTAL


SIM NÃO
Masculino 155 410 565
Feminino 165 474 639
320 884 1204

Selecionando ao acaso um desses alunos, qual a probabilidade de:


a) Cursar o curso que não queria.
b) Ser do sexo masculino.
c) Ser do sexo feminino ou cursar o curso que queria.
d) Sabendo que faz o curso que não queria qual a probabilidade de ser do sexo masculino
e) Ser do sexo masculino ou feminino.

2) Numa grande Construtora 90% dos funcionários do sexo feminino submetido a um determinado teste foi
aprovado, enquanto só 80% dos funcionários do sexo masculino foi aprovado. Qual a probabilidade de uma
mulher e um homem que estão fazendo o teste:
a) Ambos serem aprovados (R=0,72) b) Só a mulher ser aprovada (R= 0,18)
c) Ao menos um ser aprovado (R= 0,98) d) Nenhum dos dois serem aprovados. (R= 0,02)

3) Numa localidade a população tem a seguinte composição: índios 60%, japoneses 30%, alemães 10%.
Tomando-se ao acaso um indivíduo desta população:
a) índios ou japoneses (R=0,90) b) japoneses ou alemão ( R= 0,40)

4) Em uma sala de aula 35% dos alunos possuem olhos azuis, 60% possuem cabelos pretos e 12% possuem
cabelos pretos e olhos azuis. Um aluno é escolhido ao acaso.
a) Qual a probabilidade de possuir olhos azuis ou cabelos pretos. (R=0,83)
b) Se a pessoa possuir olhos azuis, qual a probabilidade de cabelos pretos? (R= 0,34)
33

5) A probabilidade uma experiência de uma determinada argamassa dar certo é de 0,8. Ao desenvolver duas
qualidades de argamassa, pede-se através do Diagrama da Árvore:
a)ambas darem certas
b)ao menos uma dar certo
c) a 1ª dá certo e a 2ª não.

6) Com os dados do exercício anterior considere agora 3 experiências


a) as 3 darem certo
b) 1ª dá certo e a 2ª não e a 3ª dá certo.
c) apenas 2 dão certo.

2-VARIÁVEIS ALEATÓRIAS

2.1-INTRODUÇÃO

Quando realizamos um experimento, não temos obrigatoriamente, que obtermos um valor numérico.
Por exemplo, ao descrevermos uma peça manufaturada, podemos associar duas categorias: “defeituosas” e
“não defeituosas”- variável qualitativa. Por um outro lado, ao estudarmos a descrição dos dados, vimos que
os recursos disponíveis para análise das variáveis quantitativas são mais ricos do que para as variáveis
qualitativas, portanto, buscaremos uma maneira de trabalharmos esta situação de uma maneira mais prática e
facilitada associando sempre um número real a qualquer evento de um espaço amostral, possibilitando
assim, a construção de modelos probabilísticos para tais variáveis.

DEFINIÇÃO 1.1 - Variável Aleatória: Sejam E um experimento e S um espaço amostral associado a esse
experimento. Uma função X que associe a cada elemento s ∈ S um número real X(s),
denomina-se Variável Aleatória (v.a.).

s.

. X(s)

Exemplo: Seja o experimento E: lançar duas moedas. O espaço amostral associado a este experimento será:
S= {CC, CK, KC, KK}
Podemos definir uma v.a. como sendo, X: número de caras obtidas nas duas moedas.
• Para o evento s1 = {CC}, temos X(s1) = 2
• Para o evento s2 = {CK}, temos X(s2) = 1
• Para o evento s3 = {KC}, temos X(s3) = 1
• Para o evento s4 = {KK}, temos X(s4) = 0
Portanto, os valores assumidos pela v.a. X são os elementos do conjunto { 0, 1, 2}.
Observações:
34
1) Embora usemos o termo “variável”, X é uma função cujo domínio é S e contradomínio e
R.
2) Para simplificar a notação, em geral, escrevemos X e não X(s).
3) Pode-se definir inúmeras v.a. para um mesmo espaço amostral S.
4) Se S é numérico, então X(s) = s.
5) As variáveis aleatórias podem ser discretas ou contínuas.

Variável aleatória discreta:

DEFINIÇÃO 2.1 – Variável Aleatória Discreta: Seja X uma v.a. Se o número de valores possíveis de X for
finito ou infinito enumerável, denominaremos X de variável aleatória discreta.

Ao trabalharmos com uma variável aleatória discreta, a função que descreve as probabilidades da variável
aleatória X assumir valores particulares será denominada Função de Probabilidade.

DEFINIÇÃO 2.2 - Função de Probabilidade. Seja X uma variável aleatória discreta. A cada possível
resultado xi associaremos um número p(xi) = P(X = xi) denominado probabilidade de xi. os
números p(xi) e i= 1,2,3,...,n devem satisfazer:


p( x ) ≥ 0, ∀ i = 1, 2, ... , n
 i

n
∑ p( x i ) = 1
 i =1

Então esta função é chamada de “Função de Probabilidade” no ponto da variável aleatória


X.

Os pares ordenados [xi , p(xi)], onde i= 1, 2, ..., n é denominado de distribuição de probabilidade de

Exemplo: Seja o experimento E: lançar 2 dados; e a variável aleatória Y: soma dos pontos obtidos na face
de cada dado. O espaço amostral associado a este experimento será:

(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)


(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)

(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
S=
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)

(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

de onde obtemos a seguinte distribuição de probabilidade:


Y 2 3 4 5 6 7 8 9 10 11 12
P(Y=yi) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
35

Caracterização de uma variável aleatória discreta

Tal como para conjuntos de dados de amostras e populações, é freqüentemente útil descrever uma
distribuição de probabilidade em termos de sua média e de sua variância. A média será chamada de valor
esperado (esperança matemática ou expectância).

VALOR ESPERADO, ESPERANÇA MATEMÁTICA OU EXPECTÂNCIA - E(X)

DEFINIÇÃO 4.1 – Seja X uma v.a.d. com possíveis valores x1, x2 , ..., xn. seja p(xi)=P(X=xi), com i=1, 2,
..., n. Então o valor esperado de X (ou esperança de X), denotado por E(X) ou µX, é
definido como:
n
E ( X ) = ∑ x i p( x i )
i =1

Exemplo: E = lançamento de um dado.


X= ponto obtido ( pode ser 1, 2, 3, 4, 5 ou 6)
P(X=xi) = 1/6, 1/6, 1/6, 1/6, 1/6, 1/6

1 1 1 1 1 1
E(X) = 1 ⋅ + 2 ⋅ + 3 ⋅ + 4 ⋅ + 5 ⋅ + 6 ⋅ = 3,5
6 6 6 6 6 6
PROPRIEDADES DA ESPERANÇA:

1ª) O valor esperado de uma constante é a própria constante.


E(K ) = ∑ Kp( x i ) = K ∑ p( x i ) = K
i i
2ª) Multiplicando-se uma variável aleatória X por uma constante, sua média fica multiplicada por essa
mesma constante.
E(KX) = ∑ Kx i p( x i ) = K ∑ x i p( x i ) = KE(X)
i i

3ª) O valor esperado da soma ou diferença de duas variáveis é a soma ou a diferença das esperanças.
E[X ± Y] = ∑∑ ( x i ± y j )p( x i , y j ) = ∑∑ x i p( x i , y j ) ± ∑∑ y j p( x i , y j )
i IJ i IJ i IJ

E[X ± Y] = ∑ x i ∑ p( x i , y j ) ± ∑ y j ∑ p( x i , y j )
i j i j

E[X ± Y] = ∑ x i p( x i ) ± ∑ y j p( y j )
i

E[X ± Y] = E[X] ± E[Y]

4ª) Somando-se ou subtraindo-se uma constante a uma variável aleatória, a sua esperança fica somada ou
subtraída da mesma constante.
E[X±K] = E[X]±E[K] = E[X] ± K

5ª) O valor esperado de uma variável aleatória centrada é zero. Diz-se que a v.a. está centrada quando se
calculam todos os desvios (xi - µx). Assim:

E[X - µx] = E[X] – E[µx] = µx - µx = 0

6ª) O valor esperado do produto de duas v.a. independentes é o produto dos valores esperados.
36
E[XY] = ∑∑ x i ⋅ y j ⋅ p( x i , y j )
i j

E[XY] = ∑∑ x i ⋅ y j ⋅ p( x i ) ⋅ p( y j ), pois X e Y são variáveis independentes


i j

E[XY] = ∑ x i p( x i )∑ y j p( y j )
i j

E[XY] = E[X] ⋅ E[Y]

Exercício: Se X e Y são v.a. independentes e E[X]=2 e E[Y]=3, determine: a) E[2X – 2] b) E[2X+3Y-5]

VARIÂNCIA DE UMA VARIÁVEL ALEATÓRIA

Embora o valor da esperança de v.a. nos dê boas informações sobre o seu comportamento, ainda não nos diz
tudo. Suponha que X represente o salário dos funcionários de uma determinada empresa e que E[X]=700,00.
Isto poderia significar que a maioria dos salários deveria estar entre R$ 600,00 e R$ 800,00; poderia também
significar que cerca de metade dos salários mais altos estejam próximos de R$ 1200,00, enquanto a outra
metade dos funcionários teriam um salário próximo a R$ 200,00. É óbvio que precisamos definir uma
medida que nos dê o grau de dispersão de probabilidade em torno da média; essa medida é chamada de
variância.

DEFINIÇÃO 4.2 – Seja S uma variável aleatória. Definamos a variância de X denotada por V(X), ou σ 2X ,
da seguinte forma:
V[ X ] = E[ X − E( X )] 2

Desenvolvendo a fórmula anterior:


V[X] = E{X 2 − 2XE(X) + [E(X)]2 }
V[X] = E[X] 2 − E[2XE(X)] + E{[E(X)]2 }, mas E[X] é uma constante
V[X] = E[X]2 − 2E[X]]E[X] + [E(X)]2
V[X[= E[X] 2 − 2[E(X)]2 + [E(X)] 2

V[ X ] = E[ X ] 2 − { E[ X ]} 2

PROPRIEDADES DA VARIÂNCIA:

1ª) A variância de uma constante é zero:


σ 2k = E[K − µ k ]2 = E[K − K ]2 = 0

2ª) Multiplicando-se uma v.a. por uma constante, sua variância fica multiplicada pelo quadrado da constante.

σ (2kx ) = E[KX − E(KX)]2 = E[KX − KE(X)] 2


σ (2kx ) = E{K[X − E(X)]}2
σ (2kx ) = K 2 E[X − E(X)]2
σ (2kx ) = K 2 σ 2x

3ª) Somando-se ou substituindo-se uma constante a uma v.a. sua variância não se altera.
37
σ 2 [X ± K ] = E[(X ± K ) − E(X ± K )]2
σ 2 [X ± K ] = E[X ± K − E(X) m E(K )] 2
σ 2 [X ± K ] = E[X ± K − E(X) m K ] 2
σ 2 [X ± K ] = E[X − E(X)]2
σ 2 [X ± K ] = σ 2X

4ª) A variância da soma ou diferença de duas variáveis aleatória independentes é a soma das respectivas
variâncias.
σ 2 (X ± Y) = σ 2x + σ 2y .Apresentaremos a seguir, alguns modelos de distribuição de probabilidades.

LISTA DE VARIÁVEIS ALEATÓRIAS

1) As chamadas diárias do Corpo de Bombeiros apresentam a seguinte distribuição:

Nº de chamadas por dia (X) 0 1 2 3 4 5


Probabilidade de chamadas
0,10 0,15 0,30 0,25 0,15 0,05
p(xi)
a) Calcular o número médio diário de chamadas, bem como o desvio padrão. 2,35; 1,31
b) Num ano de 365 dias, qual o número esperado do total de chamadas? 858
c) Calcular a probabilidade de haver no máximo duas chamadas por dia. 0,55

2) Uma Imobiliária determinou as probabilidades de fazer determinados números de vendas por semana de
casa de médio-padrão,:
Nº de vendas (X) 1 2 3 4 5 6 7 8
Probab. p(xi) 0,04 0,15 0,20 0,25 0,19 0,10 0,05 0,02
a) Calcular o número esperado de vendas semanais e a variância das vendas. 4,00 ; 2,52
b) Suponha que o vendedor da Imobiliária ganhe uma comissão de R$ 1500,00 por venda. Determine o seu
ganho esperado em comissões. 6000,00

3) Descobriu-se que a chegada de clientes a uma loja de materiais de construção, durante intervalos
aleatórios escolhidos de 10 minutos, segue a distribuição :
Nº de chegadas (X) 0 1 2 3 4 5
Probabilidade p(xi) 0,15 0,25 0,25 0,20 0,10 0,05
Calcular o número esperado de chegadas por intervalos de 10 minutos bem como sua variância. 2,0 ; 1,9

4) Um processo de fabricação produz peças com peso médio de 30 g e desvio padrão de 0,7 g. Essas peças
são acondicionadas em pacotes de uma dezena cada. A embalagem pesa em média 40 g, com variância 2,25
g2. Qual a média e o desvio padrão do peso total do pacote? 340 ; 2,67

5) O lucro unitário (L) de um produto é dado por L= 1,2V – 0,8C – 3,5. Sabendo-se que o preço unitário de
venda (V) tem média R$ 60,00 e desvio padrão de R$ 5,00 e que o preço do custo unitário (C) tem uma
distribuição de média R$ 50,00 e o desvio padrão para R$ 2,00, qual a média e o desvio padrão do lucro
unitário? 28,5 ; 6,21
38
3 - Distribuição Binomial
Consideremos um experimento aleatório ao qual associa-se a variável aleatória X. A distribuição discreta de
probabilidade de X será definida como Distribuição Binomial se atender às seguintes condições:
i) Em cada tentativa existem dois resultados possíveis mutuamente exclusivos. Eles são
chamados de sucesso (se ocorrer o evento em que estamos interessados) e fracasso (se tal
evento não ocorre).
ii) As séries de tentativas (ou observações) do experimento, são constituídas de n eventos
independentes.

iii) A probabilidade de sucesso é p e a do fracasso é q = 1-p.


Exemplo: Uma moeda é lançada três vezes. Qual a probabilidade de se obter duas caras?
P(sucesso) =P(cara)=1/2
Sejam: S: ocorre sucesso, ou seja, ocorre coroa
F: ocorre fracasso, ou seja, ocorre coroa
A= {SSF, SFS, FSS} é o evento no qual estamos interessados

Temos P(A) = P(SSF)+P(SFS)+P(FSS) pois são eventos mutuamente exclusivos e pela independência:
P(SSF) = (1/2).(1/2).1/2) = 1/8 = P(SFS) = P(FSS) ∴ P(A) = 3/8

Associando este exemplo à definição da Distribuição Binomial, teremos:

Se P(S) = p, 0<p<1 e se P(F) = q = 1-p, então P(A) = p.p.q = p2q = P(SFS) = P(FSS), de onde: P(A) = 3p2q
Observemos que estamos apenas interessados no número total de sucessos e não na ordem em que eles
ocorrem.
Para o exemplo anterior, podemos construir a seguinte tabela:

Número de Sucessos Probabilidade p=1/2


0 q3 1/8
1 pq2 3/8
2 p2 q 3/8
3 p3 1/8

Os pares ordenados [x , p(x)] constituem a distribuição binomial.

DEFINIÇÃO 4.3 – Seja uma variável aleatória X o número de sucessos de n provas onde pode
ocorrer k sucessos (e portanto n-k fracassos), temos:
n
P ( X = k ) =   p k q n−k
k 
A distribuição que apresenta a função de probabilidade acima é chamada de DistribuiçãoBinomial e será
denotada por X~B(n,p) ou seja, X tem distribuição binomial com parâmetros n e p, onde:

E[X] = np e V[X] = npq

Ex.: Uma companhia de seguros vendeu apólices a cinco pessoas, todas da mesma idade e de apresentando boa saúde.
De acordo com as tábuas atuárias, a probabilidade de que uma pessoa da idade desses assegurados esteja viva daí a 30
anos é 2/3. Calcular a probabilidade de que passados 30 anos;
39
a) todas as cinco pessoas estejam vivas; (32/243)
b) pelo menos três pessoas estejam vivas; (64/81)

4 - Distribuição Normal

DEFINIÇÃO– Seja uma variável aleatória contínua e independente X que apresenta a seguinte função
densidade:
1
e[ − ( x − µ ) / 2σ ]
2 2
f (x ) =
σ 2π

onde os parâmetros µ e σ2 são respectivamente a média e a variância populacional que satisfaz as


condições:
a) -∞ < µ < ∞
b) σ2 > 0
c) -∞ < x < ∞
Então a família de densidade definida como a função anterior são chamadas de Distribuição Normais,
denotadas por:
X ~ N(µ , σ2)

ou seja, X tem distribuição Normal com média µ e variância σ2, cuja função de distribuição é:
b −(x−µ)2
1
P(a < x < b) = ∫ e 2σ2 dx

a σ 2π

Graficamente apresentará as seguintes características:

µ
Como podemos observar, o gráfico da função densidade de uma variável normal tem a forma de um sino e é
simétrica em relação à média µ. Fixando-se a média, verificamos que o “achatamento” está diretamente
ligado ao valor de σ; um valor maior da variância significa maior dispersão da curva.

Distribuição Normal padrão

X −µ
DEFINIÇÃO – Se X ~ N(µ , σ2) , a variável aleatória Z definida como Z = tem distribuição
σ
normal com média 0 e variância 1, ou seja, Z ~N(0, 1)

Demonstração:
 X −µ 1
 = [E(X) − µ ] = [µ − µ] = = 0
1 0
E[ Z] = E
 σ  σ σ σ
40
X −µ 1
V[Z] = V  [ ] 1 1
 = V ( X ) − V (µ ) = V ( X ) = ⋅σ2 = 1
 σ  σ 2
σ 2
σ 2

Logo, Z ~(0, 1)

LISTA DE: DISTRIBUIÇÕES BINOMIAL, NORMAL .

1) Um time X tem 2/3 de probabilidade de vitória sempre que joga. Se jogar cinco partidas, calcule a
probabilidade de:
b) X vencer exatamente 3 partidas; 80/24 3
c) X vencer ao menos uma partida; 242/243
d) X vencer mais da metade das partida. 64/81

2) 20% dos refrigeradores produzidos por uma empresa são defeituosos. Os aparelhos são vendidos em
lotes com 50 unidades. Um comprador adotou o seguinte procedimento: de cada lote ele testa 20 aparelhos e
se houver pelo menos 2 defeituosos, o lote é rejeitado. Admitindo-se que o comprador tenha aceitado o lote,
qual a probabilidade de ter observado exatamente um aparelho defeituoso? (68,97%)

3) Cogita-se transferir um distrito de um certo município para um município vizinho. O distrito possui 5300
habitantes, dos quais 40 % são favoráveis à transferência. Em uma amostra de 15 habitantes, qual a
probabilidade de que ao menos cinco serem favoráveis à transferência. 0,78

4) Ao testar certo tipo de caminhão em terreno acidentado, constatou-se que 20% dos caminhões não
conseguem terminar o teste sem ao menos um pneu furado. Qual a probabilidade de que, dentre os próximos
10 caminhões a serem testados, de 5 a 8 tenham um pneu furado? (3,3%)

5) A probabilidade de um paciente sobreviver a uma delicada intervenção cirúrgica é de 0,75.


a) Qual a probabilidade de sobreviverem exatamente cinco dentre os próximos 10 pacientes a serem
submetidos a tal operação?
b) Qual a probabilidade de que 4 ou mais sobrevivam? 0,0584 ; 0,9965

6) A probabilidade de um atirador acertar o alvo é 1/3. Se ele atirar 6 vezes, qual a probabilidade de: (a)
acertar exatamente 2 tiros? (b) não acerta nenhum tiro? 80/243 ; 64/729

7) Se 5% das peças produzidas por uma máquina são defeituosas, qual a probabilidade de que, em cinco
peças escolhidas aleatoriamente, (a) haja 0 defeituosas, (b) menos de três defeituosas, (c) calcule a média e
o desvio padrão para o número de defeituosas em um lote de 500 peças. (77,4%; 99,9%; 25 e 4,9)

8) Uma empresa compra matrizes para gráfica em pacotes contendo 5 matrizes. Sabe-se que 20 % das
matrizes compradas têm defeitos de fabricação que implicam na sua inutilização. Calcular a probabilidade
de:
a) Um pacote conter mais da metade das matrizes inutilizadas. 5,79 %
b) No máximo 2 pacotes, de um grupo de 6 pacotes, conterem nenhuma matriz inutilizada por pacote.
68,8%
41
9) Um Indústria de baterias sabe, por experiência, que as baterias de sua fabricação têm vida
média de 600 dias e desvio-padrão de 100 dias, sendo que a duração tem aproximadamente distribuição
normal. Oferece uma garantia de 312 dias,. Fabrica 10.000 semanalmente.
a)Quantas serão trocadas pelo uso da garantia no final do mês?
b)As baterias 10% mais duráveis duram quanto?

10) Uma Indústria Química recicla papéis para ser vendido para o comércio local. A classificação dos
papéis é feita conforme o peso: 10% dos menos pesados como leve- 25% seguintes como médios, os 30%
seguintes como pesados e o restante 35% como extra. Sabendo-se que o peso dos papéis segue uma
distribuição normal com média 5kg e desvio padrão 2,1kg. Determinar os limites de peso para cada
classificação.

11) Uma Industria de produtos alimentícios vende um de seus produtos em latas de 900g de conteúdo
líquido. Para embalar o produto adquiriu uma máquina que permite obter o peso desejado, c/ distribuição
normal e desvio-padrão de 10g. O I.P.M. (Instituto de Peso e Medidas) exige que no máximo 5% das latas
contenham menos que o peso líquido nominal. .
a) Se a maquina for regulada para 910g, poderá satisfazer esta exigência?
b) Qual deverá ser a regulagem da máquina para que a exigência do I.P.M. seja observada?
a) Feita essa nova regulagem, as latas são remetidas ao comércio. O I.P.M. examina então uma amostra de
20 latas num supermercado. Qual a probabilidade de encontrar ao menos 3 c/ peso inferior ao
especificado na embalagem?

12) Os registros indicam que o tempo médio para se fazer um teste é aproximadamente N(80 ; 400) –
minutos. Determinar: (a) a porcentagem de candidatos que levam menos de 80 minutos; (b)se o tempo médio
concedido é de 1h e 45 min, que porcentagem não conseguirá não conseguirá terminar o teste? (c) se 150
pessoas se submetem ao teste, quantas podemos esperar que terminem o teste dentro de uma hora? 50%;
10,56%; 24

13) Usa-se um aparelho de radar para medir a velocidade dos carros numa rodovia na hora do “pico”. As
velocidades dos carros tem distribuição normal com média de 79 km/h. Determinar: (a) o desvio padrão das
velocidades, se 3% dos carros ultrapassam 90 km/h; (b) a porcentagem dos carros que trafegam a menos de
75 km/h. (5,85; 24,83%)

14) Um fabricante de baterias sabe, por experiência passada, que as baterias de sua fabricação têm vida
média de 600 dias e desvio-padrão de 100 dias, sendo que a duração tem aproximadamente distribuição
normal. Oferece uma garantia de 312 dias, isto é, troca as baterias que apresentarem falhas nesse período.
Fabrica 10.000 baterias mensalmente. Quantas deverá trocar pelo uso da garantia, mensalmente? ( 20 )

IV-INFERÊNCIA ESTATÍSTICA

INTRODUÇÃO

Inferência Estatística ou Estatística indutiva é a parte da estatística que utiliza métodos científicos
para fazer afirmações e tirar conclusões sobre características ou parâmetros de uma população, baseando-se
em resultados de uma amostra . O próprio termo “indutiva” decorre da existência de um processo de
indução, isto é, um processo de raciocínio em que, partindo-se do conhecimento de uma parte, procura-se
tirar conclusões sobre a realidade no todo. Essas são decisões baseadas em procedimentos amostrais.
Nosso objetivo é procurar a conceituação formal desses princípios intuitivos do dia-a-dia para que
possam ser utilizados cientificamente em situações mais complexas.
42
É fácil perceber que um processo de indução ( em estatística) não pode ser exato. Ao
induzir, portanto, estamos sempre sujeitos a erro. A Inferência Estatística, entretanto, irá nos dizer até que
ponto poderemos estar errando em nossas induções, e com que probabilidade. Esse fato é fundamental para
que uma indução (ou inferência) possa ser considerada estatística, e faz parte dos objetivos da Inferência
Estatística.
Em suma, a Inferência Estatística busca obter resultados sobre as populações a partir das amostras,
dizendo também, qual a precisão desses resultados e com que probabilidade se pode confiar nas conclusões
obtidas. Evidentemente, a forma como as induções serão realizadas irá depender de cada tipo de problema,
conforme será estudado posteriormente.
Estatísticas e Parâmetros
Obtida uma amostra, muitas vezes desejamos usá-la para produzir alguma característica da amostra. Por
exemplo, se queremos calcular a média da amostra ( X1 , X2 , ...,Xn ), será dada por:

X =
∑ Xi
n

4.1 - Definição - Uma estatística é uma característica da amostra, ou seja, uma estatística T é uma função de
X1 + X2 + ..., + Xn , T = f (X1 + X2 + ..., + Xn ).

As estatísticas mais comum são:

∑ Xi
X= ; média da amostra
n
∑ (X i − X)
2
S2 = ; variância da amostra
n −1
X(1) = min(X1 , X2 ,..,Xn ) : o menor valor da amostra (minimo)
X(2) = max (X1 , X2 ,..,Xn ) : o maior valor da amostra (máximo)

At = Xn - X1 : amplitude total da amostra,

∑ (X i − X)
2
σ2 = ; variância da população
n
Para facilitar a linguagem usada em Inferência Estatística, iremos diferenciar as características
da amostra e da população.

4.2 - Definição - Um parâmetro é uma medida usada para descrever uma característica da população.
Assim, se estamos colhendo amostras de uma população identificada pela variável aleatória X, então, seriam
parâmetros a média E(X) ou, ainda, sua variância V(X).
Os símbolos mais comuns são dados na tabela a seguir:

Estatística População
Média X µ
Variância S2 σ2
Nº de elementos n N
Proporção f ou P̂ p

ESTIMAÇÃO, ESTIMADOR E ESTIMATIVA

Conceito de estimação

O processo de indução que se pretende realizar sobre uma população pode ser feito, a partir de uma amostra,
de duas maneiras.
43

a) Estimação: é o processo que usa os resultados extraídos da amostra para produzir inferências sobre a
população da qual foi extraída, aleatóriamente, a amostra .
Existem dois tipos de estimação:
I) por ponto : quando, a partir da amostra, procura-se obter um único valor de um certo parâmetro
populacional.

II) por intervalo: quando a partir da amostra procura-se construir um intervalo de variação ( θˆ1 , θˆ2 ) com
uma certa probabilidade de conter o verdadeiro parâmetro populacional θˆ .

Testes de Hipóteses: é o processo que usa os resultados extraídos da amostra para testar valores de certos
parâmetros da população (testes paramétricos) ou para testar a natureza da distribuição da população (testes
não-paramétricos)

Conceito de estimador e estimativa

Estimador (( θ$ )de um parâmetro populacional θ é uma variável aleatória função dos elementos amostrais xi
( i = 1,2,..,n) , isto é:
θˆ = f(x1 , x2 ,...,xn )

Por outro lado, estimativa é o valor numérico obtido pelo estimador (ou estatística) numa amostra.

Exemplos: a) o parâmetro populacional µ pode ser estimado pelo estimador X (média da amostra).
b)O parâmetro populacional σ2 (variância) pode ser estimado pelo estimador S2 (variância
amostral).

ESTIMATIVA PONTUAL

Podemos estimar parâmetros populacionais através de uma amostra. Suponhamos, por exemplo, que,
para estimar a renda familiar média, µ , em certa região, tomamos uma amostra aleatória de 100 famílias.
Então, certamente, a média amostral, X , é um estimador razoável de µ. Porém, sabemos que X flutua em
redor de µ.: às vezes estando acima, outras vezes abaixo. A média X é uma estimativa pontual de µ.
O objetivo deste tópico será estudar uma outra forma de estimarmos os par^metros populacionais, ou
seja, buscaremos conceitos científicos de estimativas por intervalos.

Distribuição Amostral dos Estimadores


O objetivo deste tópico é estudar como se distribuem por amostragem os seguintes estimadores: o estimador
x da média populacional µ, o estimador p̂ da proporção populacional p e o estimador ( x − y ) da diferença
de médias populacionais ( µ x − µ y ). É relevante lembrarmos o seguinte esquema:

POPULAÇÃO PARÂMETROS: θ

AMOSTRAS ESTIMADORES: θ̂
θ
44

Distribuição amostral da média ( x )

De uma população X, tira-se uma amostra de tamanho n formada pelos elementos x1, x2, ..., xn. O estimador
da média populacional µ é:
1 n
x = ∑ xi
n i =1

Para auxiliar a compreensão das conclusões, consideremos o exemplo a seguir:


A população finita: 1, 2, 3, 4, 5. então N=5 ,
N
E(X)=µx= ∑ x i ⋅ p( x i ) e
i =1

( )
N
VAR(X)= σ2x = = ∑ (x − µ x ) 2 ⋅ p ( xi ) = E X 2 − [E ( X )]
2
i fazendo a função de distribuição de
i =1
probabilidade, tem-se:
X 1 2 3 4 5 Σ
p(x) 1/5 1/5 1/5 1/5 1/5 -
xp(x) 1/5 2/5 3/5 4/5 5/5 3
2
x p(x) 1/5 4/5 9/5 16/5 25/5 11

1 15
E(X) = µx = (1 + 2 + 3 + 4 + 5) = =3 ∴ µx = E(x) = 3
5 5

VAR(X)= 11-32 = 11-9 = 2 ∴ VAR ( X ) = 2

Buscando relacionar a caracterização da população com a amostra, pode-se por exemplo, tomar todas as
amostras com reposição (independência) de tamanho 2. O número total de amostras será 52 = 25, distribuídas
da seguinte forma:
(1,1) (1,2) (1,3) (1,4) (1,5)
(2,1) (2,2) (2,3) (2,4) (2,5)
(3,1) (3,2) (3,3) (3,4) (3,5)
(4,1) (4,2) (4,3) (4,4) (4,5)
(5,1) (5,2) (5,3) (5,4) (5,5)

Calculando-se as respectivas médias amostrais, tem-se:

1,0 1,5 2,0 2,5 3,0


1,5 2,0 2,5 3,0 3,5
2,0 2,5 3,0 3,5 4,0
2,5 3,0 3,5 4,0 4,5
3,0 3,5 4,0 4,5 5,0
O estimador x é uma variável aleatória discreta, e facilmente pode-se calcular sua esperança e variância. A
distribuição de probabilidade da média é:

x 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 Σ


p( x ) 1/25 2/25 3/25 4/25 5/25 4/25 3/25 2/25 1/25 -
x p( x ) 1/25 3/25 6/25 10/25 15/25 14/25 12/25 9/25 5/25 3,0
x 2 p( x ) 1,0/25 4,5/25 12,0/25 25,0/25 45,0/25 49,0/25 48,0/25 40,5/25 25,0/25 10,0
45

n
A esperança da média amostral, E( x ) = ∑ x p( x ) = 3
i =1
i i ∴ µ x = E(X) = 3

enquanto que a VAR( X) = E( X2 ) − [E( X)]2 será VAR( X) = 10 − 32 = 1 ∴ σ2x = VAR( X) = 1


A partir destes resultados, temos as seguintes proposições:

Proposição 1) A média das médias amostrais ou E( x ) é igual à média µ populacional, ou µ x = E(X) = 3

Proposição 2) A variância da média amostral é igual à variância populacional dividida pelo tamanho da
σ2
amostra, ou VAR( X) = σ2x =
n

Graficamente, podemos comparar a distribuição de probabilidade para a população


P(x)

1/5

0
0 1 2 3 4 5X

e a distribuição das médias amostrais


P(x)
1/5

3/20

1/10

1/20

0
0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 x

Observe que a medida que o tamanho da amostra aumenta, independendo da distribuição da população
original, a distribuição amostral de X aproxima-se cada vez mais de uma distribuição normal. Esse
resultado, fundamental na teoria de Inferência Estatística, é conhecido como Teorema do Limite Central.

Teorema 3.2 - Para amostras aleatórias simples ( X1 , X2 ,.., Xn ), retiradas de uma população com média µ
e variância σ2, a distribuição amostral da média X = (X1 + X2+..+Xn)/n aproxima-se de uma distribuição
normal com média µ e variância σ2/n , quando n →∞.

Corolário 3.1 - Se (X1 + X2+..+Xn) é amostra aleatória simples da população X com média µ e variância
σ2 , e X = (X1 + X2+..+Xn)/n então,
X−µ
Z= ∼ N(0,1)
σ
n
Note que usamos a transformação usual de reduzir a distribuição de X a uma distribuição normal padrão.
46

Definição - Seja e a variável aleatória que mede a diferença entre a estatística X e o parâmetro
µ, isto é, e = X - µ .

Corolário 3.2 - A distribuição de e aproxima-se de uma distribuição normal com média 0 e variância σ2/n ,
isto é, e = N( 0, σ2/n).
Teorema do Limite Central afirma que X aproxima-se de uma normal quando n →∞. É fácil verificar, que
a rapidez dessa convergência depende da distribuição da população da qual a amostra é retirada. Se a
população original é próxima da normal, sua convergência é rápida; já, se a distribuição da população tem
outra distribuição, essa convergência é mais demorada. Como regra prática, aceita-se que para amostras com
mais de 30 elementos a aproximação já pode ser considerada muito boa.
Portanto, se X é uma população com distribuição normal de média µ e variância σ2, e se dessa população
 σ2 
retirarmos amostras de tamanho n, então x : N  µ,  isto é: a distribuição da variável x por amostragem
 n 
casual simples será sempre normal com a mesma média da população X e variância n vezes menor. Isso
significa que quanto maior o tamanho da amostra, menor será a variância de x, ou o estimador x será mais
preciso à medida que o tamanho da amostra aumentar. Se a população X não for normal, x terá distribuição
“aproximadamente” normal

 σ2 
x ≅ N  µ, 
 n 

É importante destacar que se a população for finita e de tamanho N conhecido, e se a amostra de tamanho n
σ N−n
dela retirada for sem reposição, tem-se: σ x = .
n N −1

Distribuição amostral das proporções


Seja a população X definida como uma variável aleatória tal que:
X = 1 se o elemento da população tem a característica de interesse.
X = 0 se o elemento da população não tem a característica de interesse.
Sabe-se que P(X=1) = p, P(X=0) = q e p+q = 1, sem nos preocuparmos com demonstrações, podemos dizer
que se retirarmos uma amostra de tamanho n→∞, x1, x2, ... xn, dessa população, onde x será o número de
sucessos na amostra, isto é, o número de elementos da amostra com a característica que se deseja estudar,
tem-se:
 pq 
p̂ ≅ N  p , 
 n 
x
se p é desconhecida e a amostra com reposição é grande, trabalha-se com sua estimativa p̂0 = e teremos o
n
p̂0q̂0
desvio padrão sendo σp̂ = .
n
47

LISTA DE DISTRIBUIÇÃO AMOSTRAL

1) Certas válvulas fabricadas por uma companhia têm uma vida média de 800 horas e desvio padrão de 60
horas. Determinar a probabilidade de uma amostra aleatória de 16 válvulas, retiradas do grupo, ter vida
média: (a) entre 790 e 810 horas; (b) inferior a 785 horas; (c) superior a 820 horas. R) a- 0,4950 b- 0,1587
c- 0,0912

2)Um Fiscal toma uma amostra de n= 36 obras de uma população de obras a serem fiscalizadas. O desvio
padrão da população é desconhecido, mas o dp da amostra é de S= 43m2. Se o verdadeiro valor da média da
metragem das obras é de 260m2 qual a probabilidade de que a média da amostra seja menor ou igual a
250m2? (0,0815)

3) A capacidade máxima de um elevador é de 500 kg. Se a distribuição X dos pesos dos usuários é suposta
N(70,100):
a- Qual a probabilidade de 7 passageiros ultrapassarem esse limite? (35,27%)
b- E seis passageiros? (0,02%)

4) Uma variável X tem distribuição normal, com média 10 e desvio padrão 4. Aos participantes de um jogo,
é permitido observar uma amostra de qualquer tamanho e calcular a média amostral. Ganha o prêmio aquele
cuja média amostral for maior que 12. a) Se um participante escolher uma amostra de tamanho 16, qual a
probabilidade de ele ganhar o prêmio? b) se outro participante escolher uma amostra de tamanho 25, qual a
probabilidade de ele ganhar o prêmio? a- 2,28% b- 0,62%

5) ) Determinar a probabilidade de, entre 300 candidatos inscritos para uma Multinacional: a) menos que
40% serem homens. ( 0,0003). b) entre 43% e 57% serem homens. ( 0,9847 )

Intervalos de Confiança
A estimativa de um parâmetro por pontos (pontual) não possui uma medida do possível erro
cometido na estimação.
Uma maneira de expressar a precisão da estimação é estabelecer limites, que com certa
probabilidade incluam o verdadeiro valor do parâmetro da população. Esses limites são chamados “limites
de confiança”: determinam um intervalo de confiança no qual deverá estar o verdadeiro valor do parâmetro.
Logo, a estimativa por intervalo consiste na fixação de dois valores tais que (1-α) seja a
probabilidade de que o intervalo, por eles determinado, contenha o verdadeiro valor do parâmetro.
α : nível de significância
(1-α) : coeficiente de confiança ou nível de confiabilidade
Logo, a partir de informações da amostra, devemos calcular os limites de um intervalo, valores
críticos, que em (1-α)% dos casos inclua o valor do parâmetro a estimar e em α% dos casos não inclua o
valor do parâmetro.

µ
48

Intervalo de confiança para a média quando a variância populacional σ2 for


conhecida:
Deseja-se estimar a média da população X conhecendo o valor da variância σ2, ou seja X:N (? , σ2).
 σ2 
Com a utilização das distribuições amostrais, x ≅ N  µ,  ,
 n 
Procedimentos para a construção do intervalo de confiança (IC):
• Retira-se da população uma amostra casual simples de n elementos.
• Calcula-se a média da amostra x .
σ2 σ
• Calcula-se o desvio padrão da média amostral σ x = = .
n n
• Fixa-se o nível de significância α e determina-se o valor de Z correspondente.
α α
P( z > z α ) = α ou seja, P(z > z α ) = e P(z < -zα ) =
2 2 2 2

α (1-α) α
2 2
-zα/2 zα/2

Usando uma notação simplificada para o intervalo de confiança para a média populacional, temos:
 σ σ 
IC[µ , 1-α] =  x − z α ⋅ ; x + zα ⋅ 
 2 n 2 n
ou
 σ   σ 
 x − zα ⋅  < µ <  x + zα ⋅  , com (1-α) de confiabilidade.
 2 n  2 n

Ex.: Um engenheiro civil está analisando resistência a compressão do concreto. A resistência à compressão é
distribuída de forma aproximadamente normal, com uma variância de σ 2 = 1.000 ξ 2. Uma amostra aleatória
de 30 copos de prova tem uma resistência média à compressão de X = 3250 ξ .
Construir o intervalo de confiança de 96% para a resistência média à compressão.
Solução:
n = 30 x = 3250 σ = 31,62 (desvio padrão populacional conhecido)
(1-α) = 0,96 (1-α/2) = 0,98 z0,98= 2,05
Logo:
 σ   σ 
Intervalo:  x − z α ⋅  < µ <  x + zα ⋅ 
 2 n  2 n
31,62 31,62
3250 − (2,05) ⋅ < µ < 3250 + (2,05)
30 30

3238,165 < µ < 3261,84


49

Concluímos que a resistência média à compressão está 3238,17 à 3261,84 ξ com uma confiança de 96%.

Erro máximo da amostra para a estimativa:


Se o valor de n for suficientemente grande, n ≥ 30, e a população for infinita (ou
significativamente grande para não ser preciso aplicar o fator de correção para população finita), tem-se:

σ
e = zα ⋅
2 n

Ex.: Um grupo de técnicos em eficiência pretende utilizar a média de uma amostra aleatória de tamanho n =
150 para estimar a aptidão média (avaliada por certo teste padronizado) dos operários em uma grande
empresa de construção. Se, com base na experiência, os técnicos admitem que σ = 6,2 para tais dados, o que
podem eles afirmar, com 0,99 de probabilidade, sobre o erro máximo de sua estimativa?
Solução:
n= 150 σ = 6,2 z0,005 = 2,575
6,2
e = 2,575 ⋅ ≈ 1,30
150
Assim, os técnicos em eficiência podem afirmar com 99% de confiança, que o erro da estimativa será no
máximo de 1,30.

Pela fórmula do erro máximo definida anteriormente, pode-se determinar o tamanho da


amostra necessário para atingir determinado grau de precisão na estimativa do parâmetro.
2
 z ⋅σ
n =  α/2 
 e 

Sabe-se que o erro na estimação da taxa média de queima do propelente de um foguete é de 1,5, com uma
confiança de 95%, σ = 2 e z0,025 = 1,96, definir o tamanho requerido na amostra.

Solução:
z0,025 = 1,96 e = 1,25 σ=2
2
 1,96 ⋅ 12 
n=  ≈7
 1,5 
Quando estivermos trabalhando com o tamanho de amostras, o resultado final deverá sempre
ser arredondado para o interiro imediatamente superior. Portanto, o tamanho da amostra é de 139.

Distribuição de t de Student
x−µ
A variável Z = tem distribuição normal. Quando não conhecemos a variância σ2, devemos usar seu
σx
s2 s
estimador s e tem-se: sx =
2
= .
n n
x −µ
A variável definida como t φ = é denominada variável com distribuição de “t de Student” com φ graus
sx
de liberdade, onde φ = n-K (n é o número de informações independentes da amostra e K número de
parâmetros da população a serem estimados além do parâmetro inerente ao estudo).
Quando n é grande, s2 se aproxima bastante de σ2, o que faz com que a variável t se aproxime
50
da variável normal Z.

Intervalo de confiança para a média quando a variância populacional σ2 for


desconhecida:
O procedimento padrão é o mesmo que o adotado para anteriormente.
• Retira-se uma amostra de n elementos da população.
- Se n > 30, usa-se a distribuição normal com s2.
- Se n ≤ 30, usa-se a distribuição t de Student, com φ - n-1 graus de liberdade.
1 n
• Calcula-se a média da amostra x = ∑ x i .
n i =1
• Calcula-se a variância amostral:
  n  
2

  ∑ xi  
1 1  n 2  i =1   1 n 2 2
s =
2

n −1
∑ ( x − x )2
= ∑
n − 1  i =1
x i −  ou s 2
= ∑ x − nx 
n − 1  i =1
n  
 
 
s2 s
• Determina-se o desvio padrão para a distribuição amostral da média sx = = .
n n
Observe que s x é o estimador de σ x (estimador do erro padrão).
• Fixa-se o nível de significância α e determina-se o valor de t correspondente.

1-α

tα/2 ttα/2
Usando uma notação simplificada para o intervalo de confiança para a média populacional, temos:

 
 S S 
IC[µ , 1-α] =  x − tα ⋅ ; x + tα ⋅
 2 n 2 n
 
 
ou
 S   S 
 x − tα ⋅  < µ <  x + tα ⋅  , com (1-α) de confiabilidade
 2 n  2 n

Ex.: Querendo determinar o peso médio de nicotina dos cigarros de sua produção, um fabricante recolheu
uma amostra de 25 cigarros, obtendo∑xi= 950 mg e ∑ xi2 = 3610 mg2. Supondo a distribuição normal
para o peso de nicotina, construir um IC para µ ao nível de confiabilidade de 95%.
Solução:
950 1  950 2 
n=25 x= = 38 s2 =  36106 −  = 0,25 s = 0,25 = 0,5
25 24  25 
 s   s 
IC(µ,95%) =  x − t α ⋅  < µ <  x + tα ⋅ 
 n  n
51

 0 .5   0 .5 
IC(µ,95%) =  38 − 2,06 ⋅  < µ <  38 + 2,06 ⋅ 
 25   25 

IC(µ,95%) = 37,794 < µ < 38,206

Conclui-se que o peso médio da nicotina encontra-se entre 37,794 e 38,206 mg com 95% de confiabilidade.

Intervalo de confiança para proporções


Seja uma amostra de tamanho n > 30. Deseja-se construir um intervalo de confiança para a proporção
populacional p. o procedimento é semelhante aos anteriores.
x
• Calcula-se a proporção da amostra p̂ = , onde x é o número de vezes que ocorre o
n
“sucesso” do experimento.
• Como desconhecemos a verdadeira proporção, determina-se o desvio padrão para a
p̂q̂
distribuição amostral da proporção utilizando sua estimativa sp̂ = .
n
• Fixa-se o nível de significância α e determina-se o valor de z correspondente.

1-α

-z α/2 z α/2
 
 
 p̂ − p 
P ≤ z α  = 1 − α , que desenvolvido determina o intervalo de confiança para a proporção.
 p̂ ⋅ q̂ 
 
 n 
 p̂q̂ p̂q̂ 
IC[µ , 1-α] = p̂ − z α ⋅ ; p̂ + z α ⋅ 
 2 n 2 n 
ou
   
 p̂ − z α ⋅ p̂q̂  < p <  p̂ + z α ⋅ p̂q̂  , com (1-α) de confiabilidade.
 n   n 
 2
 2

Ex.: Para se estimar a porcentagem de alunos de um curso favoráveis à modificação do currículo escolar,
tomou-se uma amostra de 100 alunos, dos quais 80 foram favoráveis à mudança.
a) Qual o erro da estimativa admitindo-se 96% de confiança?
b) Para a situação anterior, qual será o IC para a verdadeira porcentagem de alunos favoráveis à
mudança?
Solução:
80
a) n=100 p̂ = = 0,8 1-α= 0,96
100
p̂q̂ 0,8 ⋅ 0,2
erro= zα ⋅ erro= 2,05 ⋅ = 0,082
2 n 100
O erro máximo cometido na estimativa é de 0,082
52
 p̂q̂   
b) O IC será:  p̂ − z α ⋅  < p <  p̂ + z α ⋅ p̂q̂ 
 n   n 
 2
  2

IC(p; 96%)= (0,8 – 0,082) < p < (0,8+0,082)

IC(p; 96%)= 0,7180 < p < 0,8820 ou 71,80% < p < 88,20%

Pode-se afirmar com 96% de confiabilidade que a proporção dos alunos da faculdade favoráveis à mudança
curricular está entre 71,80% e 88,20%.

Intervalo de confiança para a diferença de média quando as variâncias


populacionais forem conhecidas:
A construção do Intervalo de confiança (IC) é semelhante a realizada para a média quando conhecemos a
variância populacional. Deve-se observar a distribuição para a diferença das médias.
Sejam duas amostra de tamanho n e m retiradas respectivamente de populações com distribuições normais
independentes X e Y com média µx e µy e desvios padrões σx e σy. O IC para a diferença das médias (µx -
µy) será;
 σ2x σ y
2
σ2x σ y 
2

IC[µx - µy , 1-α] = ( x − y ) − z α ⋅ + ; ( x − y ) + zα ⋅ + 
 2 n m 2 n m

ou
 σ2x σ y 
2  σ2x σ y 
2
( x − y ) − z α ⋅ +  
< (µ x − µ y ) < ( x − y ) + z α ⋅ +  com (1-α) de confiabilidade.
 2 n m
 

2 n m

Ex.:Testes de resistência à tensão foram feitos em duas estruturas contendo 2 teores de alumínio. Essas
estruturas foram usadas na fabricação das asas de um avião comercial. De experiências passadas c/ o
processo de fabricação dessas estruturas e com o procedimento de testes, os desvios-padrão das resistências
à tensão são considerados conhecidos. Calcular o intervalo de confiança de 90% Os dados obtidos são?
Solução: Temos:
X1: Resistência à Tração da Amostra 1
XB: Resistência à Tração da Amostra 2
σ1= 1,0 σ2 = 1,5 1-α = 90%
n1 =10 n2 = 12 ( x A - xB ) =
x1 =87,6 y =74,5

σ2x σ y
2
1 2,25
Erro = zα ⋅ + Erro = 1,645 ⋅ + = .0,88............
2 n m 10 12

O erro máximo da estimativa da diferença das médias é ......, logo o IC é:


 σ x2 σ y 
2  σ x2 σ y 
2
( x − y ) − zα ⋅ +  < ( µ x − µ y ) < ( x − y ) + zα ⋅ + 
 2 n1 n2 
 

2 n1 n2 

IC(%)= 12,22kg/mm2< (µA-µB) < 13,98kg/mm2


53

Desse modo, o intervalo de confiança de 90% p/ diferença na resistência média à tensão é de 12,22kg/mm2 a
13,98kg/mm2 .

Intervalo de confiança para a diferença de média quando as variâncias


populacionais forem iguais e desconhecidas:
 Para o caso de pequenas amostras, consideramos pequenas se (n+m-2) < 30, é utilizada a
distribuição de Student.
 s2 s2 s 2 s2 
IC[µx - µy , 1-α] = ( x − y ) − t α ⋅ + ; ( x − y) + t α ⋅ + 
 2 n m 2 n m 
(n − 1)sn2 + (m − 1)sm2
onde s2 =
n+m−2
 s 2 s2 s2 s 2 
IC[µx - µy, 1-α] = ( x − y ) − t α ⋅ + < (µ x − µ y ) < ( x − y ) + t α ⋅ +  , com (1-α) de
 2 n m 2 n m 
confiabilidade.

 Para o caso em que as amostras forem suficientemente grandes, (n+m-2) ≥ 30, a distribuição
aproxima-se da distribuição normal e o IC para a diferença de médias será:
 s2 s2 s2 s2 
IC[µx - µy , 1-α] = ( x − y ) − zα ⋅ + ; ( x − y) + zα ⋅ + 
 2 n m 2 n m 
(n − 1)sn2 + (m − 1)sm2
onde s2 =
n+m−2
 s2 s2 s2 s 2 
IC[µx - µy, 1-α] = ( x − y ) − zα ⋅ + < (µ x − µ y ) < ( x − y ) + z α ⋅ +  , com (1-α) de
 2 n m 2 n m 
confiabilidade.

Ex.: Para um particular produto da construção civil A, a média de vendas por estabelecimento no último ano, em uma
amostra de n =10 estabelecimentos foi de x A = R$3425,00 com sA= R$ 200,00. Para um segundo produto B, a
média de vendas por estabelecimento, em uma amostra de tamanho m = 12, foi de xB = R$3250,00 , com sB= R$
175. Supondo-se que as amostras tenham sido retiradas de populações normais, estimar a diferença entre o nível médio
de vendas por estabelecimento no último ano, utilizando um intervalo de confiança de 90%.
Solução:
XA: Vendas do produto A no último ano. sA= 200,00 sB= 175 1-α = 90%
XB: Vendas do produto B no último ano. n =10 n = 12 ( x - x ) = 175,00
A B

Erro = x A = 3425,00 xB = 3250,00 t10%= 1,72


s2 s2 (n 1 -1)s 2A + ( n 2 −1) sB2
tα ⋅ + onde s 2 =
n1 n2 (n 1 + n 2 -2)

9 ⋅ 200 2 + 11 ⋅ 175 2 34843,75 34843,75


s2 = = 34843,75 , teremos: Erro = 1,72 ⋅ + = 137,85
(10 + 12 − 2) 10 12
O erro máximo da estimativa da diferença das médias é 137,85, logo o IC é:
 S2 S2  S2 S 2 
( x − y ) − tα ⋅ +  < ( µ x − µ y ) < ( x − y ) + tα ⋅ + 
 2 n 1 n 2   2 n 1 n 2 
54
(175,00 - 137,85) < (µ x − µ y ) < (175,00 + 137,85)

IC[(µA-µB); 90%]= 37,15 < (µA-µB) < 312,85

Podemos afirmar, ao nível de 95% de confiança, que a diferença entre a venda média dos dois produtos está
entre R$ 37,15 e R$ 312,85.

LISTA DE INTERVALO DE CONFIANÇA

1)De uma distribuição normal com σ = 1,96, obteve-se a seguinte amostra: 25,2 ; 26,0 ;26,4 ; 27,1 ; 28,2 ;
28,4. Determinar o intervalo de confiança para a média da população, sendo α = 0,05 e α = 0,10. (1,57 ;
1,32)

2) Um analista do departamento pessoal de uma construtora seleciona aleatoriamente os registros de 16


empregados horistas que menos ganham, e acha que a média de salário por hora é R$ 2,00. Supõe-se que os
salários na firma sejam distribuídos normalmente. Se o desvio padrão dos salários é conhecido, e igual a R$
0,90, estimar a taxa média de salário desses horistas na firma usando um intervalo de confiança de 80%.
(0,29)

3) Calcule o intervalo de confiança para a média em cada um dos casos abaixo: (2,94; 3,18; 2,07)
___________________________________________________________________________________

Média Amostral Tamanho da amostra Desvio Padrão Coeficiente de


Populacional Confiança
_____________________________________________________________________________________
170 cm 100 15 cm 95%
165 cm 184 30 cm 85%
180 cm 225 30 cm 70%
_____________________________________________________________________________________

4) Colhida uma amostra de 30 peças, forneceu os seguintes pesos (kg):


250 265 267 269 271 275 277 281 283 284
287 289 291 293 293 298 301 303 306 307
307 309 311 315 319 322 324 328 335 339
Construir um intervalo de 95% de confiança para o peso Sugestão: adote α = 5%.

5) De um grupo muito grande de Estatística, extraíram-se aleatoriamente 40 notas:


71 74 65 72 64 42 62 62 58 82
49 83 58 65 68 60 86 86 74 53
78 64 55 87 56 50 58 58 57 75
58 86 64 56 45 73 86 86 70 73

Construir um intervalo de 95% de confiança para a nota média de todo o grupo.

6) Da produção de válvulas fabricadas por uma companhia retira-se uma amostra de 400 válvulas, e obtém-
se a vida média de 800 horas e o desvio padrão de 100 horas.
a) Qual o intervalo de confiança de 99% para a vida média da população?
b) Com que confiança dir-se-ia que a vida média é 800 ± 0,98?
c) Que tamanho deve ter a amostra para que seja de 95% a confiança na estimativa 800 ± 7,84?

7)Uma amostra de 300 habitantes de uma certa cidade mostrou que 180 desejavam a água fluorada.
Encontrar os limites de confiança de 90% e 95% para a proporção da população favorável a fluoração.
55

8) Uma amostra aleatória de 625 donas-de-casa revela que 70% delas preferem a marca X de detergente.
Construir um intervalo de confiança para a proporção das donas-de-casa que preferem X com α = 10%.

9)Suponha que estejamos interessados em estimar a porcentagem de consumidores de um certo produto. Se


uma amostra de tamanho 300 forneceu 100 indivíduos que consomem o dado produto, determine: (a) o I.C.
de p, com coeficiente de confiança de 95% (b) o tamanho da amostra para que o erro da estimativa não
exceda a 0,02 unidades com probabilidade de 95%.

10) Em uma a.a. de 2500 pneus fabricados por determinada companhia, 20% fogem aos seus
padrões.Construir um intervalo de 95% de confiança para a proporção populacional de pneus que não estão
dentro dos padrões técnicos estabelecidos. (0,0157)

11)Um artigo em Fire Tecnology investigou 2 agentes diferentes de expansão de espumas que podem ser
usados nos bocais de um equipamento spray contra incêndio. Uma amostra de 5 observações c/ uma espuma
formada por um filme aquoso (EFFA) teve a média de 4,7 e um desvio padrão de 0,6. Uma amostra aleatória
de 5 obs. C/ uma espuma formada por concentração alcoólicas (EFSCA) teve uma média de 6,9 e um
desvio-padrão de 0,8. Encontre o intervalo de confiança de 95% p/ a diferença na expansão média desses 2
agentes. Supor que ambas as populações sejam dist. normalmente..

12) Uma amostra aleatória de 50 famílias de uma comunidade A apresenta uma renda média familiar de X =
R$ 13.800,00, com desvio padrão s x = R$ 2.200,00. Uma amostra aleatória de 50 famílias da comunidade B

apresenta uma média Y = R$ 14.800,00 com desvio padrão s y = R$ 2.800,00. Estimar a diferença na renda
familiar entre as duas comunidades, utilizando um IC de 95%.

13) Um artigo no jornal Hazardous Waste and Hazardous Materials (Vol. 6, 1989) reportou os resultados de
uma análise do peso de cálcio em cimento padrão e em cimento contendo chumbo. Níveis reduzidos de
cálcio indicaram que o mecanismo de hidratação no cimento foi bloqueado, permitindo a água atacar em
várias localizações na estrutura do cimento. 10 amostras de cimento padrão tiveram um teor médio
percentual em peso de cálcio de 90,0, com desvio padrão de 5,0, enquanto 15 amostras do cimento c/
chumbo tiveram um teor percentual em peso de cálcio de 87,0 c/ um desvio padrão de 4,0. . Considerando o
teor percentual em peso de cálcio seja normalmente distribuído encontrar o intervalo de confiança de 95% p/
os 2 tipos de cimento..

TESTES DE HIPÓTESES
Freqüentemente devemos tomar decisões sobre populações com base em informações amostrais das
mesmas. Tais decisões, chamam-se decisões estatísticas. Na tomada de decisões é útil formular hipóteses ou
suposições sobre as populações em jogo. Tais hipóteses, que podem ser verdadeiras ou não, chamam-se
hipóteses estatísticas e, em geral, consistem de afirmações sobre as distribuições de probabilidade das
populações, como por exemplo:
a média populacional da altura dos brasileiros é 1,65m;
a proporção de veículos com defeito de fábrica de uma determinada marca X é 10% (p = 0,10);
a distribuição das idades dos alunos da UEM é normal;
Os processos que nos permitem decidir aceitar ou rejeitar uma hipótese, ou determinar se amostras
observadas diferem significativamente dos resultados esperados são chamados Testes de Hipóteses. O
objetivo é fornecer ferramentas que nos permitam validar ou refutar uma hipótese, através de resultados da
amostra. Os Testes de Hipóteses podem ser de dois tipos:
56
i) Não Paramétricos: quando formulamos hipóteses com respeito à natureza da
distribuição da população. Estes testes não dependem dos parâmetros populacionais, nem de suas respectivas
estimativas.

ii) Paramétricos: quando formulamos hipóteses com respeito ao valor de um parâmetro


populacional.
Neste tópico, vamos tratar dos testes ditos paramétricos, pois se referem a hipóteses sobre
parâmetros populacionais, isto é, feita determinada afirmação sobre uma população, usualmente sobre um
parâmetro desta, desejamos saber se os resultados de uma amostra contrariam ou não tal afirmação.
Os testes de hipótese representam uma regra de decisão que permite aceitar ou rejeitar uma hipótese
formulada. Tem-se, então, as duas seguintes hipóteses iniciais:
1) Hipótese nula ( H0): é aquela que será testada; admite-se aqui que a diferença observada entre o
estatístico( estimador) amostral e o parâmetro populacional é devido apenas ao acaso, ou seja, essa diferença
não é significativa .
2)Hipótese alternativa (H1): é qualquer hipótese diferente da hipótese nula, isto é, é aquela que será aceita
caso o teste indique que H0 deva ser rejeitada; aceitando essa hipótese, conclui-se que a diferença citada é
significativa.
As hipóteses estatísticas para o parâmetro θ, podem ser formuladas como segue.

a)Teste Bilateral: quando utilizamos ambas as “caudas” da distribuição normal padronizada


H 0 : θ = θ0
a) 
 H1 : θ ≠ θ 0
b)Teste Unilateral à Direita: quando utilizamos a “cauda” direita da distribuição normal padronizada.
H 0 : θ = θ 0
b) 
H 1 : θ > θ 0
c)Teste Unilateral à Esquerda: quando utilizamos a “cauda” esquerda da distribuição normal padronizada
H 0 : θ = θ0
c) 
 H1 : θ < θ 0

O objetivo de se testar uma hipótese é tomar uma decisão, se possível correta. Devemos não rejeitar
ou rejeitar H0, que é a hipótese usada como referência.
Suponhamos que exista essa hipótese, a qual será considerada válida até prova em contrário,
referente a um dado parâmetro da população. Essa hipótese será testada com base em resultados amostrais,
sendo aceita ou rejeitada. Nos problemas de testes de hipóteses, vamos basear nossas conclusões em
variáveis obtidas através da amostra ou amostras disponíveis
Para melhor entendermos a regra de decisão adotada, é interessante estudarmos os tipo de
erros que podemos cometer e as respectivas probabilidades de cometermos esses erros.
Podemos cometer dois tipos de erros, ou seja:

Erro Tipo I - rejeitar H0, quando H0 é verdadeiro


A probabilidade desse erro será simbolizada por α ( nível de significância).

α = P( cometer erro tipo I) = P(rejeitar H0  H0 é verdadeiro)

Erro Tipo II Aceitar H0, quando H0 é falso.


A probabilidade de cometer esse erro será simbolizada por β.

β = P( cometer erro Tipo II) = P( aceitar H0 H0 é falso)


57

Esquematicamente, o quadro abaixo mostra as diversas situações que podem ocorrer num
teste de hipótese:

REALIDADE

DECISÃO H0 é verdadeira H0 é falsa

Aceitar H0 Decisão correta Erro tipo II

Rejeitar H0 Erro tipo I Decisão correta

PROCEDIMENTO GERAL DO TESTE DE HIPÓTESES

A construção de um teste de hipótese, para um parâmetro populacional, consiste em dado uma


variável X de uma população normal e uma hipótese sobre determinado parâmetro θ dessa população. Por
exemplo, afirmamos que esse valor é um número θ0. Colhe-se uma amostra aleatória de ”n” elementos dessa
população, e através dela deseja-se comprovar ou refutar tal hipótese.
Construímos as hipóteses nula e alternativas: H0: θ = θ0 e H1 : θ < θ0; ou H1 : θ > θ0 ou H1: θ ≠
θ0.

– PASSO PARA CONSTRUÇÃO DE UM TESTE DE HIPÓTESE

Daremos a seguir uma seqüência que pode ser usada sistematicamente para qualquer teste de
hipótese.

Passo 1: Enunciar H0 e H1.


Passo 2: Usar a teoria estatística e as informações para decidir qual estatística (estimador) será usada no
julgamento de H0. Fixar α
Passo 3: Construir a região crítica (RA= Região de Aceitação de H0 e RC= Região de Rejeição de Ho ou
Região Crítica.
Passo 4: Usar as informações fornecidas pela amostra para encontrar o valor da estatística que definirá a
decisão.
Passo 5: Se o valor da estatística observada na amostra não pertencer a RC, não rejeite H0. Caso contrário,
rejeite-o.

Testes para a média de uma população, com variância conhecida


Passo 1: - Hipóteses
Enunciar as hipóteses (deve ser feito no início da pesquisa, antes de se realizar a experiência
amostral)

caso (a) caso b) caso c


 H 0 : µ = µ0 H 0 : µ = µ 0  H 0 : µ = µ0
  
 H1 : µ ≠ µ 0 H 1 : µ > µ 0  H1 : µ < µ 0
58
Passo 2 – Fixar o erro α e avaliar a variável do Teste
σ2
Como X ≅ N ( µ , ) para qualquer tamanho de amostra, n, se a população for normal e n ≥ 30 se a população
n
não for normal, a estatística (ou variável) do teste é: Z
Passo 3 - Região Crítica
Fixar o limite do erro tipo I, α, e determinar a região crítica.

Caso(a) - Devemos determinar x1 e x2, tais que P(x1 ≤ X ≤ x2)=1- α ou, equivalentemente, devemos
determinar ± z α 2 , tais que P( −z α 2 ≤ Z ≤ z α 2 ) = 1 − α .

RA RA
RC
RC

x1 µ0 x2 − zα / 2 0 z α / 2 RC

A região de rejeição da hipótese H0 , ou região crítica, será:

RC= {x ∈ ℜ / x > x 1 ou x > x 2 } ou


RC= {z ∈ ℜ / z < −z 1 / α ou z > z α 2 }

Caso (b) - Devemos determinar x , tal que P( X ≤ x ) = 1 − α ou, equivalentemente, devemos determinar z α
tal que P ( Z ≤ z α ) = 1 − α .

RA RA
RC RC

µ0 Zα 0
A região de rejeição da hipótese H0 , ou região crítica, será:
RC= {x ∈ℜ / x < xc } ou RC= {z ∈ℜ / z < zα }

Caso (c) - Devemos determinar x , tal que P( X ≥ x ) = 1 − α ou, equivalentemente, devemos determinar − z α ,
tal que P ( Z ≥ − z α ) = 1 − α .

RA RA
RC RC

µ0 zα
xc
A região de rejeição da hipótese H0 , ou região crítica, será:
RC= {x ∈ℜ / x > xc } ou RC= {z ∈ℜ / z > − zα }
59

Passo 4 - Valor da Estatística Teste (z)


Usando as informações fornecidas pela amostra, determinar o valor da estatística (ou variável) que definirá a
decisão
X − µ0
z=
σ n
Passo 5 – Conclusão
Se o valor amostral x estiver na região crítica, isto é, x < x 1 ou x > x 2 , rejeita-se H0. Isto equivale a dizer
que se o valor z da variável do teste, obtido no passo 4, estiver na região de rejeição, ou seja,
z > z α 2 ou z < - z α , rejeita-se H0. Caso contrário, não podemos rejeita H0.
2

EXEMPLO: Suponhamos que os cientistas tenham estabelecido que se os cigarros contém em média, 30
miligramas ou mais de nicotina, existe a certeza de se produzir câncer no pulmão. Um fumante está disposto
a se arriscar se a média µ de nicotina for menor que 30 miligramas. Ensaios sobre 100 cigarros da marca A
mostraram uma média de 26 miligramas de nicotina. Se σ = 8 miligramas e considerando um nível de
significância de 2%, qual a decisão que o fumante deve tomar?
Como, µ = 30, n = 100, x = 26 , σ = 8 e α = 2%, teremos:
Passo 1: Hipóteses
H 0 : µ = 30

H 1 : µ < 30

• H0 (O conteúdo médio de nicotina nos cigarros é de 30 miligramas e o fumante não se arrisca a fumar)
• H1 (O conteúdo médio de nicotina nos cigarros é significativamente inferior a 30 miligramas e o fumante
se arrisca a fumar)
Passo 2: Avaliar a variável do teste e fixar o limite do erro α. Como o teste é unilateral à esquerda e α =
0,02. Da tabela obtemos z α = −2,05
X − µ0
Uma vez que σ é conhecido, a estatística do teste é: Z=
σ n
Passo 3: Região críticae assim:

RA

RC

zα= -2,05
RC= {z ∈ ℜ / z < −2,05}
Passo 4: Valor da Estatística Teste
x − µ0 26 − 30
zcal = ⇒ z cal = = −5
σ 8
n 100

Passo 5: Conclusão: Como z cal < z α (-5 < 2,05), rejeita-se H0, ou seja, com 98% de certeza, não há
evidências de que o conteúdo médio de nicotina nos cigarros seja de 30 miligramas e o fumante se arrisca a
fumar, ou, ao nível de 2% de significância, rejeitamos a hipótese H0, há evidências de que o teor de nicotina
seja menor que 30.
60

Teste para µ com σ2 desconhecido e N < 30

Seja X=N(µ ; σ2 ) e X = N(µ ; σ2 /n)


Suponhamos que desconhecemos a variância populacional ( σ2 ), o que geralmente acontece, na
maioria das vezes . Se n< 30, utilizamos a variância amostral (S2 )como estimativa pontual da variância
populacional.
A seguir vamos construir os procedimentos para fazermos o teste de hipótese.

Passo 1 – Hipóteses

Enunciar as hipóteses (Deve ser feito no início da pesquisa, antes de se realizar a experiência amostral.

Caso (a) caso (b) caso (c)


H 0 : µ = µ 0  H 0 : µ = µ0  H 0 : µ = µ0
  
H 1 : µ ≠ µ 0  H1 : µ > µ 0  H1 : µ < µ 0

Passo 2: Avaliar a variável do teste e fixar o limite do erro α


Com σ2 é desconhecido devemos estimá-lo. Assim a variável do teste é “t” com n-1 graus de liberdade.

Passo 3: Região crítica


Caso (a) - Devemos determinar x1 e x2, tais que P( x1 ≤ x ≤ x 2 ) = 1 − α ou, equivalentemente, devemos
determinar ± t α 2 , tais que P( − t α 2 ≤ t ≤ t α 2 ) = 1 − α .

1− α 1− α
α α α α
2 2 2 2
x1 µ0 x2 0
− tα tα
A região Crítica para o teste será: 2 2

RC= {x ∈ ℜ / x < x 1 ou x > x 2 } ou RC= {t ∈ ℜ / t < − t 1 / α ou t > t α 2 }

Caso (b) - Devemos determinar x , tal que P( X ≤ x ) = 1 − α ou, equivalentemente, devemos determinar tα
tal que P( t ≤ t α ) = 1 − α .

1− α 1− α
α α
µ0 xc 0 tα
61
Cuja região crítica pode ser definida:

RC= {x ∈ ℜ / x > x c } ou RC= {t ∈ ℜ / t > t α }

Caso (c) - Devemos determinar x, tal que P( X ≥ x ) = 1 − α ou, equivalentemente, devemos determinar − t α ,
tal que P( t ≥ − t α ) = 1 − α .

1− α
RA α
RC

xc µ0 -tα 0
Cuja região crítica pode ser definida:
RC= {x ∈ ℜ / x < x c } ou RC= {t ∈ ℜ / t < − t α }

Passo 4: Valor da estatística teste (t)


X − µ0
t=
s n
Passo 5: Conclusão
a) Se o valor amostral x estiver na região de rejeição (caso a), isto é, x < x 1 ou x > x 2 , rejeita-se H0. Isto
equivale a dizer que se o valor t da variável do teste, obtido no passo 4, estiver na região de rejeição ou
crítica, tc<-tα/2 ou tc>tα/2, rejeita-se H0. Caso contrário não existe evidências para se rejeitar H0.
Idem para os casos b) e c).

Obs.: no caso em que n ≥ 30, o procedimento é o mesmo, podendo-se utilizar valores Z para aproximar
valores t na determinação das regiões críticas.

EXEMPLO: Estamos desconfiados de que a média das receitas municipais per capita das cidades pequenas
(0 - 20.000 habitantes) é maior do que a das receitas do estado, que é de 1229 unidades. Para comprovar ou
não esta hipótese, sorteamos dez cidades pequenas, e obtivemos os seguintes resultados:
1230, 582, 576, 2093, 2621, 1045, 1439. 717, 1838, 1359
Utilize um nível de significância de 5%
Passo 1: Hipóteses
H 0 : µ = 1229

H 1 : µ > 1229
H0: A média das receitas municipais per capita das cidades pequenas é de 1229 unidades.
H1: A média das receitas municipais per capita das cidades pequenas é significativamente superior a 1229
unidades.
Passo 2: Avaliar a variável do teste e fixar o limite do erro α.
Uma vez que σ é desconhecido e n < 30, assim a variável do teste é “t” com n-1 graus de liberdade.
O teste é unilateral à direita, os graus de liberdade são dados por gl = n -1 = 10 - 1 = 9 e sendo α = 0,05, da
tabela obtemos tα = 1,83.

Passo 3: Região crítica


Assim:

α
tα = 1,83
62
RC= {t ∈ ℜ / t > 1,83}

Passo 4: Valor da Estatística Teste


Valor da estatística da decisão é:
X − µ0 1350 − 1229
t cal = ⇒ t cal = = 0,57
s n 675,8
10
Passo 5:Conclusão: Como t cal < t α (0,57 < 1,83) , não rejeitamos, ou seja, com 95% de certeza, não há
evidências de que a média das receitas municipais per capita das cidades pequenas seja significativamente
superior a 1229 unidades.

Teste de hipótese para a proporção de sucesso populacional (P).


Seja X uma variável aleatória discreta com uma distribuição binomial de probabilidade, isto
é, X = N(np; np(1-p)) e p̂ = X/n ou p̂ %= (X/n)100, a proporção de sucesso de uma amostra de tamanho n
extraída dessa população, e sabemos que f ≅ N(p ; p(1-p)/n)
A seguir vamos utilizar os passos para fazer um teste de hipótese

Passo 1: Hipóteses
caso (a) caso (b) caso (c)
 H 0 : p = p0 H 0 : p = p 0 H 0 : p = p 0
  
 H1 : p ≠ p0 H 1 : p > p 0 H 1 : p < p 0

Passo 2: Avaliar a variável do teste e fixar o limite do erro α.


Como p̂ para n ≥ 30, a estatística (ou variável) do teste é: “ Z “
Passo 3: Região crítica: Determinar a região crítica.
a) Devemos determinar f1 e f2, tais que P(f1 ≤ p̂ ≤ f2) = 1 - α ou, equivalentemente, devemos determinar
± z α 2 , tais que P( − z α 2 ≤ Z ≤ z α 2 ) = 1 − α .

α
1-α α
1-α
2 2 α α
2 2

f1 p0 f2 − zα 2 0 zα 2
Cuja região crítica ou região de rejeição será:
RC= {p̂ ∈ ℜ / p̂ < f1 ou p̂ > f 2 } ou RC= {z ∈ ℜ / z < −z 1 / α ou z > z α 2 }

b) Devemos determinar fc, tal que P(p̂ ≤ f c ) = 1 − α ou, equivalentemente, devemos determinar zα tal que
P( Z ≤ z α ) = 1 − α .
63

α α
1-α 1-α

p0 fc 0 zα
Cuja região crítica ou região de rejeição será:
RC= {p̂ ∈ ℜ / p̂ > f c } ou RC= {z ∈ ℜ / z > z α }

Devemos determinar fc tal que P(p̂ ≥ f c ) = 1 − α ou, equivalentemente, devemos determinar − z α , tal que
P( Z ≥ −z α 2 ) = 1 − α .

α 1-α α 1-α
fc p0 − zα 0

Cuja região crítica ou região de rejeição será:


RC= {p̂ ∈ ℜ / p̂ < f c } ou RC= {z ∈ ℜ / z < z α }
Passo 4: Valor da Estatística Teste (Zcal )
Usando as informações fornecidas pela amostra determinar o valor da estatística (ou variável) que definirá a
decisão:
p̂ − p 0
z cal =
p 0 (1 - p 0 )/n
Passo 5: Conclusão: Se o valor amostral p̂ estiver na região de rejeição, isto é, p̂ <f1 ou p̂ >f2, rejeita-se H0.
Isto equivale a dizer que se o valor zcal da variável do teste, obtido no passo 4, estiver na região crítica, ou
seja, z cal < − z α l ou z cal > z α 2 , rejeita-se H0. Em caso contrário, não rejeitamos H0.
2
Idem para os casos b) e c).

EXEMPLO: Uma Empresa de construção acusou o fabricante de telhas, dizendo que mais de 20% das
unidades fabricadas apresentam defeito. Para confirmar sua acusação, ele usou uma amostra de tamanho 50,
onde 27% das telhas eram defeituosas. Mostre como o fabricante poderia refutar a acusação. Utilize um
nível de significância de 10%.
Passo 1: Hipóteses
H 0 : p = 0,20

H 1 : p > 0,20
H0: A proporção das unidades fabricadas que apresentam defeito é 20%.
H1: A proporção das unidades fabricadas que apresentam defeito é significativamente superior a 20%
64
Passo 2: Avaliar a variável do teste e fixar o limite do erro α. O Teste é unilateral à direita e
sendo α = 0,10, da tabela obtemos z α = 1,28 .
Passo 3: Região crítica

z α = 1, 28

RC= {z ∈ ℜ / z > 1.28}

Passo 4: Valor da estatística teste


O valor da estatística da decisão é:
p̂ − p 0 0,27 − 0,20
z cal = ⇒ z cal = = 1,24
p 0 (1 - p 0 ) (0,20)(0,8 0)
n 50

Passo 5: Conclusão:Como z cal < z α (1,24 < 1,28) , aceita-se H0, ou seja, com 90% de certeza, não há
evidências de que a proporção das telhas fabricadas que apresentam defeitos seja significativamente superior
a 20%.

Teste de hipótese para a diferença de duas médias populacionais com variâncias


conhecidas
Passo 1: Hipóteses

Enunciar as hipóteses (Deve ser feito no início da pesquisa, antes de se realizar a experiência amostral).

caso (a) caso (b) caso (c)


 H 0 : µ1 = µ 2 ( µ1 − µ 2 = 0) H 0 : µ 1 = µ 2 (µ 1 − µ 2 = 0)  H 0 : µ1 = µ 2 ( µ1 − µ 2 = 0)
  
 H1 : µ1 ≠ µ 2 ( µ1 − µ 2 ≠ 0) H 1 : µ 1 > µ 2 (µ 1 − µ 2 > 0)  H1 : µ1 < µ 2 ( µ1 − µ 2 < 0)

Passo 2: Avaliar a variável do teste e fixar o limite do erro α. Fixar o limite do erro α e determinar a região
crítica.
σ 12 σ 22
Como X 1 − X 2 ≅ N ( µ 1 − µ 2 , + ) , a estatística (ou variável) do teste é: Z
n1 n 2

Passo 3: Região crítica

a) -Determinar y1 e y2, tais que P(y1 ≤ X 1 − X 2 ≤ y2) = 1 - α ou, equivalentemente, determinar


z α 2, tais que P( − z α 2 ≤ Z1 − Z2 ≤ z α 2 ) = 1 − α .

1-α
α α
1− α
2 2 α α
2 2
y1 µ1 − µ 2 y2 − z α2 0 z α2
65
Sua região crítica será:
RC= {( x 1 − x 2 ) ∈ ℜ /( x 1 − x 2 ) < y 1 ou ( x 1 − x 2 ) > y 2 }

{ }
ou
RC= z ∈ ℜ / z < −z α ou z > z α
2 2

b) - Devemos determinar x , tal que P(( X 1 − X 2 ) ≤ y ) = 1 − α ou, equivalentemente, devemos determinar


zα tal que P( Z1 − Z 2 ≤ z α ) = 1 − α .

α 1-α α
1-α zα
µ1 − µ 2 y 0

A região crítica para este teste é:


RC= {( x 1 − x 2 ) ∈ ℜ /( x 1 − x 2 ) > y} ou RC = {z ∈ ℜ / z > z α }

c) - Devemos determinar x , tal que P( X 1 − X 2 ≥ y ) = 1 − α ou, equivalentemente, devemos


determinar − z α , tal que P( Z 1 − Z 2 ≥ − z α ) = 1 − α .

1-α
α α 1-α

y µ1 − µ 2 − zα 0

A região crítica para este teste é:


RC= {( x 1 − x 2 ) ∈ ℜ /( x 1 − x 2 ) < y} ou RC = {z ∈ ℜ / z < z α }

Passo 4: Valor da Estatística Teste (zcal )


Usando as informações fornecidas pela amostra, determinar o valor da estatística (ou variáveis) que definirá
a decisão:

( X1 − X 2 ) − (µ1 − µ 2 ) ( X1 − X 2 ) − 0
Z cal = =
σ12 σ 22 σ 12 σ 22
+ +
n1 n 2 n1 n 2
Passo 5: Conclusão
Caso (a) - Se o valor amostral X 1 − X 2 estiver na região de rejeição, isto é
( X 1 − X 2 ) > y 2 ou ( X 1 − X 2 ) < y 1 , rejeita-se H0. Isto equivale a dizer que se o valor zcal da variável do
teste, obtido no passo 4, estiver na região de rejeição, ou seja, z < −z α 2 ou z cal ≤ z α 2 , rejeita-se H0. Caso
contrário não rejeita-se H0.
Idem para os casos (b) e (c).

EXEMPLO 5: Uma Empresa de concreto enche seus caminhões, com variabilidade praticamente constante
e independente dos ajustes na média, dada por um desvio padrão de 50kg. Duas amostras retiradas em dois
66
períodos de trabalho consecutivos, de dez e de vinte caminhões forneceram pesos líquidos
médios de, respectivamente, 2390kg e 2395kg. Desconfia-se quanto ao peso médio fornecido possa ter sido
modificada entre a coleta das duas amostras. Qual a conclusão, ao nível de 5% de significância?
Resolução:
Temos que σ = 50g; x 1 = 2390 g; x 2 = 2395 g; n1 = 10 e n2 = 20

Passo 1: Hipóteses

H0 : O peso líquido médio é o mesmo nos dois períodos.


H1 :O peso líquido médio é significativamente diferente nos dois períodos

Passo 2: Fixar o limite do erro α e avaliar a variável do Teste.


Como σ1 = σ2 = σ é conhecido, a estatística do teste é: Z. O teste é bilateral e sendo α = 0,05, da tabela
obtemos z α 2 = 1, 96 .

Passo 3: Região crítica

α/2 α/2

1-α

-1,96 1,96

Passo 4: Valor da Estatística do Teste

2390 − 2395
O valor da estatística da decisão é: zcal = ≅ −0,2582
1 1
50 +
10 20

Passo 5: Conclusão: Como z cal < − z α 2 (-0,2582 < 1,96), aceita-se H0, ou seja, com 95% de certeza, o peso
líquido médio é o mesmo nos dois períodos.

Teste de hipóteses para a diferença de duas médias com variâncias desconhecidas e


iguais

No caso em que σ 12 e σ 22 são desconhecidos com n1 < 30 e n2 <30, mas supondo que σ 12 = σ 22 = σ 2 , o
procedimento é análogo, usando a distribuição “t” com n1+n2-2 graus de liberdade.

Passo 1: Hipóteses
Enunciar as hipóteses (Deve ser feito no início da pesquisa, antes de se realizar a experiência amostral).
67
Caso(a) Caso(b) Caso(c)
H 0 : µ 1 = µ 2 H0 : µ 1 = µ 2 H 0 : µ 1 = µ 2
  
H1: µ 1 ≠ µ 2 H1: µ 1 > µ 2 H 1 : µ 1 < µ 2

Passo 2: Fixar o limite do erro α e avaliar a variável do Teste.

Passo 3: Região crítica:


a) - Determinar y1 e y2, tais que P(y1 ≤ X 1 − X 2 ≤ y2) = 1 - α ou, equivalentemente determinar
t α 2 , tais que P( − t α 2 ≤ t1 − t 2 ≤ t α 2 ) = 1 − α .

α
2 1− α α
2
α α
2 1− α 2

y1 µ1 − µ 2 y2 −t α 2 0 tα 2
RC= {( x 1 − x 2 ) ∈ ℜ /( x 1 − x 2 ) < y 1 ou ( x 1 − x 2 ) > y 2 }

{ }
ou
RC= t ∈ ℜ / t < − z α ou t > z α
2 2

b) - Devemos determinar y, tal que P( X 1 − X 2 ≤ y ) = 1 − α ou, equivalentemente, devemos determinar tα

tal que P( t ≤ t α ) = 1 − α .

1-α α 1-α α

µ1 − µ 2 y 0 tα 2

Cuja região crítica será:


RC= {( x 1 − x 2 ) ∈ ℜ / ( x 1 − x 2 ) > y} ou RC = {t ∈ ℜ / t > t α }

c) Devemos determinar y, tal que P( X 1 − X 2 ≥ y ) = 1 − α ou, equivalentemente, devemos determinar −t α ,


tal que P( t ≥ − t α ) = 1 − α .

α
α 1-α 1-α
y µ1 − µ 2 −t α 0

Cuja região crítica será:


68
RC= {( x 1 − x 2 ) ∈ ℜ / ( x 1 − x 2 ) < y} ou RC = {t ∈ ℜ / t < −t α }
Passo 4: A estatística do Teste:

( X1 − X 2 ) − ( µ 1 − µ 2 ) ( X1 − X 2 ) − 0 (n1 − 1)S12 + (n2 − 1)S22


t= = onde: Sc2 =
1 1 1 1 n1 + n2 − 2
Sc + Sc +
n1 n 2 n1 n 2

Passo 5: Conclusão
Caso (a) - Se o valor amostral X 1 − X 2 estiver na região de aceitação, isto é ( x 1 − x ) < y 1 ou ( x 1 − x ) < y 2 ,
rejeita-se H0. Isto equivale a dizer que se o valor tcal da variável do teste, obtido no passo 4, estiver na região
de rejeição, ou seja, t cal < −t α 2 ou t cal > t α 2 , rejeita-se H0. Caso contrário, não se rejeita H0.
Idem para os casos (b) e (c).

EXEMPLO: Para verificar o grau de adesão de uma nova cola para vidros, preparam-se dois tipos de
montagem: cruzado (A), onde a cola é posta em forma de X, e quadrado (B), onde a cola é posta apenas nas
4 bordas. Os resultados da resistência para duas amostras de 10 cada estão abaixo. Que tipo de conclusão
poderia ser tirada? Utilize um nível de significância de 5%.
Método A: 16, 14, 19, 18, 19, 20, 15, 18, 17, 18
Método B: 13, 19, 14, 17, 21, 24, 10, 14, 13, 15
A partir dos resultados acima obtemos:
x A = 17 , 40 ; x B = 16 , 00
S A = 1, 90 ; S B = 4, 24
Passo 1: Hipóteses
H0 :O grau de adesão de uma nova cola para vidros é a mesma para os dois tipos de montagem.
H1:O grau de adesão de uma nova cola para vidros é significativamente diferente para os dois tipos de
montagem

Passo 2: Fixar o limite do erro α e avaliar a variável do Teste. Como σ1, σ2 são desconhecidos e n1 < 30, n2
< 30, a estatística do teste é: t. Teste é bilateral, os graus de liberdade são dados por gl = n1 + n2 - 2 = 18 e
sendo α = 0,05, da tabela obtemos t α 2 = 2,10.

Passo 3: Região crítica

α/2 α/2

-2,10 2,10

RC= {t cal ∈ ℜ / t cal < −2,10 ou t cal > 2,10 }

Passo 4: Valor da Estatística Teste


O valor da estatística da decisão é:

(n1 − 1)S12 + (n2 − 1)S22 2 9(1,90)2 + 9( 4,24)2


Sc2 = Sc = ≅ 10,79 ⇒ sc = 3,29
n1 + n2 − 2 18
69

( X1 − X 2 ) 17,40 − 16
Então: t = t cal = = 0,95
1 1 1 1
Sc + 3,29 +
n1 n 2 10 10

Passo 5: Conclusão
Como − t α 2 < t cal < t α 2 (-2,10 < 0,95 < 2,10), não rejeita-se H0, ou seja, com 95% de certeza, não há
evidências de que o grau de adesão de uma nova cola para vidros seja significativamente diferente para os
dois tipos de montagem.

LISTA DE EXERCÍCIOS - TESTE DE HIPÓTESE

1) Uma fábrica de automóveis anuncia que seus carros consomem, em média 11 litros por 100 km, com
desvio padrão de 0,8 litro. Uma revista decide testar essa afirmação e analisa 35 carros dessa marca,
obtendo 11,4 litros por 100 km, como consumo médio. Admitindo que o consumo tenha distribuição
normal, ao nível de 10% o que a revista concluirá sobre o anúncio da fábrica?
2) A duração em horas de trabalho de 5 rolo compressor foi de 9420, 8200, 9810, 9290 e 7030 horas.
Sabe-se que a duração dos rolos compressores dessa marca é normal com desvio padrão de 55 horas.
Ao nível de 3%, testar:
H 0 : µ = 8700 H 0 : µ = 8700 H 0 : µ = 8700
a) b)  c) 
H1 : µ ≠ 8700 H1 : µ > 8700 H1 : µ < 8700
3) O salário dos empregados das indústrias de construção civil tem distribuição normal, com média 4,5
salários mínimos, com desvio padrão de 0,5 salários mínimos. Uma indústria emprega 49
empregados, com um salário médio de 4,3 s.m. Ao nível de 5% podemos afirmar quew essa indústria
paga salários inferiores à média?
4) A tensão de ruptura dos cabos produzidos por um fabricante apresenta a média de 1.800 kg e o
desvio padrão de 100 kg. Mediante nova técnica no processo de fabricação, proclamou-se que a
tensão de ruptura pode ter aumentado. Para testar essa declaração, ensaiou-se uma amostra de 50
cabos, tendo-se determinado a tensão média de ruptura de 1.850 kg. Pode-se confirmar a declaração
ao nível de significância de 1%?

5) um comprador de blocos de cimento acredita que a qualidade dos produtos da marca A esteja
deteriorado. Sabe-se, por experiência passada, que a força média de esmagamento desses blocos era
de 400 libras, com desvio padrão de 20 libras. Uma amostra de 100 blocos da marca A forneceu uma
força média de esmagamento de 390 libras. Verifique se a suspeita é correta ao nível de 2%.

6) Um metalúrgico decide testar a pureza de um certo metal, que supõe ser constituído exclusivamente
de manganês. Adota para isso o critério da verificação do ponto de fusão. Experiências anteriores
mostraram que esse ponto de fusão se distribuía normalmente com média de 1260º e desvio padrão
de 2º. O metalúrgico realizou 4 experiências, obtendo 1267º, 1269º, 1261º e 1263º. Poderá ele aceitar
que o metal é puro ao nível de 5%?

7) Uma amostra de 500 cerâmicas foram retiradas ao acaso sendo que 52% era o tipo de porcelanato A.
Poderia esta amostra ter sido retirada de uma população que tivesse 50% do porcelanato A? (α=
8%)

8) Um fabricante garante que, pelo menos 95% do equipamento que forneceu a uma fábrica está de
acordo com as especificações. O exame de uma amostra de 200 peças desse equipamento revelou que
18 estavam defeituosas. Testar a afirmativa, nos níveis de significância a) 1% e b) 5%.
70
9) A experiência tem mostrado que 40% dos estudantes são reprovados num exame de
ESTATÍSTICA. Se 40 de 90 estudantes fossem reprovados, poderíamos concluir que esses
estudantes são inferiores em Estatística? (α= 5%)

10) Um crítico de televisão afirma que 80% de todos os espectadores consideram inconveniente o nível
de ruído de certo comercial. Se uma amostra aleatória de 320 espectadores de TV inclui 245 que
acham inconveniente o nível de ruído do comercial, teste, ao nível de 5% de significância, se ha
diferença significativa entre a proporção amostral e a definida pelo crítico.

11)Uma Empresa está em dúvida se deve optar por uma fabrica A ou B de lâmpadas para trabalhar em
um novo condomínio. Resolve então testar 10 lâmpadas, obtendo: da marca A média de 1160h e
desvio padrão de 90, e da marca B: média de 1140h e desvio padrão de 80h.. Pode se aceitar como
verdadeiro o teste feito com a amostra?

12)Em um teste feito 12 alunos conseguiram média 7,8 e desvio padrão 0,6, ao passo que 15 alunos de
outra turma do mesmo curso, conseguiram 7,4 com desvio padrão de 0,8. O que se pode concluir ao α
= 5%?

13)O QI de 16 estudantes de um bairro menos nobre apresentou média de 107 pontos c/ desvio padrão
de 10 pontos, enquanto que 14 estudantes de um bairro nobre apresentaram média de 112 pontos c/
desvio padrão de 8 pontos. Os QIs apresentam ~N em ambas as regiões. Há diferença significativa
entre os QIs médios dos 2 grupos?

14) Uma pesquisa feita nos EUA alega que o custo médio diário para refeições e alojamento no Texas é
menor que no estado de Washington. Sabe se que no Texas o desvio padrão é de $15 e em
Washington é $28. Tomou se então 50 pessoas do Texas e a média de gasto foi de $208 e em 35
pessoas de Washington o gasto médio foi $218. Sendo α = 0,1, há evidências suficientes para
confirmar a alegação?

15)Um engenheiro responsável pela segurança anota a distância percorrida após a frenagem por dois
tipos de pneus. Do tipo A sabe se que o desvio padrão é de 4,7 pés, e do tipo B é de 4,3 pés. Tomou
se então 35 pneus de cada tipo resultando do tipo A 42 pés e do tipo B 45 pés. Sendo α = 10% , o
engenheiro pode confirmar a alegação que a distância média de frenagem do 2 tipos de pneus é a
mesma?

V-CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

I - INTRODUÇÃO

Nos métodos estatísticos precedentes consideramos sempre a existência de uma única variável de
interesse. Vários problemas no trabalho estatístico, todavia, envolvem muitas variáveis. Veremos agora dois
métodos estatísticos para lidar com este tipo de problema. Faremos nosso estudo com o caso mais simples
em que temos apenas duas variáveis de interesse. O emprego do método pode ser estendido a mais de duas.

2 – CORRELAÇÃO LINEAR ENTRE DUAS VARIÁVEIS


Avaliar se existe associação entre duas características quantitativas é objetivo de muitos estudos em
biologia e ciências da saúde. Um ecologista pode estar interessado em saber, por exemplo, se há associação
entre a quantidade de chumbo medida na água e o volume de dejetos despejados em determinado rio; um
médico pode querer avaliar se a pressão arterial está relacionada à idade das pessoas. Quando se pode
demonstrar que existe associação entre duas variáveis quantitativas, isto é, quando se constata que elas
variam juntas, diz-se que as variáveis estão correlacionadas.
71

Exemplo 1: Um professor deseja saber se existe correlação entre o tempo dedicado ao estudo e o
desempenho dos alunos em determinada disciplina. Sorteados 8 estudantes dessa disciplina, são obtidas, por
exemplo, as informações constantes da tabela 1, onde x representa o número de horas de estudo, e y, a nota
obtida em uma prova, para cada aluno. Fica difícil concluir alguma coisa observando diretamente os dados
na tabela, pois há grande variação nos resultados. Por isso, o primeiro passo é tentar organiza-los em um
gráfico, para melhor visualizar as relações entre as variáveis.

Tabela 1. Nº de horas de
estudo e nota obtida por 8
alunos em uma prova.

Aluno x (horas) y (nota)


A 8 10
B 7 8
C 6 4
D 3 8
E 3 6
F 6 9
G 5 7
H 2 4
Nota: dados fictícios.

1. DIAGRAMA DE DISPERSÃO:

Consideremos uma amostra de n pares de dados (xi , yi) referentes a duas variáveis X e Y.
Uma maneira de visualizar (avaliar) uma possível correlação entre as observações de X e de Y, é
através do diagrama de dispersão, em que os valores destas variáveis são representadas por pontos, num
sistema cartesiano. Esta representação é feita sob forma dos n pares ordenados (xi , yi), onde x é um valor
observado da variável X e y é o correspondente valor da variável Y. Através deste diagrama pode-se notar se
há uma tendência dos pontos se disporem ou não em torno de uma reta.

Se a disposição dos pontos forem em torno de uma reta de inclinação positiva (figura a), isto indica a
existência de dependência entre as variáveis, ou seja, há correlação linear positiva. Da mesma forma, o
diagrama pode indicar a existência de uma dependência inversa, isto é, há uma correlação linear negativa
(figura b) se os pontos estiverem dispostos em torno de uma reta com inclinação negativa. Se nenhuma
destas duas tendências se verificar, o diagrama indica a não existência de dependência linear entre as
variáveis (figura c).

(a) (b) (c)


Figura 1. Diagrama de dispersão para amostras correlacionadas positivamente (a), negativamente (b) e não
correlacionadas (c).
72

Exercício. Construir o diagrama de dispersão para o exemplo1.

2. COEFICIENTE DE CORRELAÇÃO:
Uma outra maneira de se avaliar a correlação é usar um coeficiente, que tem a vantagem de ser um
número puro, isto é, independente da unidade de medida das variáveis. Isto interessa bastante, pois se pode
ter duas unidades de medida diferentes para as variáveis (como nota e horas), o que dificultaria a
interpretação da associação. O coeficiente de correlação produto-momento (r) é uma medida da
intensidade ("força") de associação existente entre duas variáveis quantitativas X e Y, e é definido como
n ∑ ( xy) − (∑ x )(∑ y)
r=
(n ∑ x 2 − (∑ x ) 2 )(n ∑ y2 − (∑ y) 2 )

Este coeficiente é uma medida que se situa no intervalo compreendido entre - 1 e + 1. Isto é, -1 < r < 1.

• r = - 1, indica uma correlação linear negativa perfeita, ou seja, os pontos experimentais estão
sobre uma reta de inclinação negativa.
• r = + 1, indica uma correlação linear positiva perfeita, ou seja, os pontos experimentais estão
sobre uma reta de inclinação positiva.
• r = 0 , indica ausência de relação linear entre X e Y. Pode haver outro tipo de
relação não linear.

Deve-se frisar, no entanto, que muitas vezes, um alto valor do coeficiente de correlação, embora
estatisticamente significativo, pode não implicar qualquer relação de causa e efeito, mas simplesmente a
tendência que aquelas variáveis apresentam quanto a sua variação conjunta.
Análises estatísticas baseadas no coeficiente de correlação, em geral, são adequadas quando estão
envolvidas duas variáveis entre as quais não há relação de dependência funcional, embora possam ser
correlacionadas. O caso em que há dependência funcional será estudado mais adiante, no problema de
regressão.
Exemplo 2. Para os dados do exemplo 1 temos:

Quadro 1. Quadro auxiliar para o cálculo do coeficiente de correlação

Aluno X (horas) Y (nota) X2 Y2 XY


A 8 10 64 100 80
B 7 8 49 64 56
C 6 4 36 16 24
D 3 8 9 64 24
E 3 6 9 36 18
F 6 9 36 81 54
G 5 7 25 49 35
H 2 4 4 16 8
Soma 40 56 232 426 299

n ∑ ( xy) − (∑ x )(∑ y) 8(299) − (40)(56)


r= ⇒ r= = 0,58
(n ∑ x 2 − (∑ x ) 2 )(n ∑ y2 − (∑ y) 2 ) [8(232) − (40) ][8(426) − (56)
2 2
73

3. TESTE DE HIPÓTESES
Quando se calcula o coeficiente r em uma amostra, é necessário ter em mente que se está, na
realidade, estimando a associação verdadeira entre x e y existente na população. No exemplo anterior, foi
obtido o valor de r = 0,58 . No entanto, não se pode ter certeza de que na população de alunos haja,
efetivamente, correlação entre horas de estudo e nota da prova, pois foi estudada apenas uma parte da
população. O valor obtido poderia ser casual, representando um erro devido à amostragem. Para realizar um
teste de hipóteses sobre a existência de correlação na população, usa-se um raciocínio análogo ao visto nos
testes de hipóteses sobre médias.

Sendo r calculado com base em n elementos de uma amostra aleatória, ele representa apenas uma
estimativa do verdadeiro coeficiente de correlação populacional que representaremos por ρ .
Por isso, muitas vezes desejamos saber se um dado valor de r, combinado com o respectivo tamanho
da amostra, permite concluir, a um dado nível de significância, que realmente existe correlação linear entre
as variáveis. Realizamos então um teste para o coeficiente de correlação populacional ρ com base no
coeficiente amostral r.
A seqüência para a realização do teste é análoga à seqüência apresentada para os testes paramétricos
vistos anteriormente, usando a distribuição "t" de Student com n - 2 grau de liberdade e com as mesmas
restrições teóricas.

Passo 1: Hipóteses:
H 0 : ρ = 0 (X e Y não são correlacionadas)
Teste bilateral: 
H1 : ρ ≠ 0 (X e Y são correlacionadas)
H 0 : ρ = 0 (X e Y não são correlacionadas)
Teste unilateral à direita: 
H1 : ρ > 0 (X e Y são correlacionadas positivamente)
H 0 : ρ = 0 (X e Y não são correlacionadas)
Teste unilateral à esquerda: 
H1 : ρ < 0 (X e Y são correlacionadas negativamente)

Passo 2: Fixar α
Sob H0 e usando as informações amostrais, o valor da estatística do teste será:

Passo 3: Fixar α e construir a região.


Passo 4: Calcular o valor da estatística, através das informações amostrais, que definirá a decisão.
n−2
tc = r
1− r2

Passo 5: Conclusão .
a) Se o valor amostral r estiver na região de não rejeição, isto é, x 1 < r < x 2 , não se rejeita H 0 . Isto
equivale a dizer que se o valor tc da variável do teste, obtido no passo 4, estiver na região de não rejeição, ou
seja, − t α 2 ≤ t c ≤ t α 2 , não se rejeita H 0 . Caso contrário rejeita-se H 0 .
Idem para os casos b) e c).

Exemplo 2: Realizemos um teste de hipóteses para os dados do exemplo 1, ao nível de 5% se significância.


As hipóteses são:
H 0 : ρ = 0

H 1 : ρ ≠ 0
74
ou de outra forma : H 0 : O número de horas de estudo não está correlacionado com as notas.
H 1 : O número de horas de estudo está correlacionado com as notas.
Para α = 5% e gl = 6 , da tabela t-Student temos t α / 2 = 2,447 .
Da amostra temos r = 0,58 . Assim,
6
t = 0,58 = 1,74
1 − (0,58) 2
Como − 2,445 < 1,74 < 2,445 , não rejeitamos H 0 , ou seja , não existe evidência de correlação entre o tempo
dedicado ao estudo e o desempenho obtido na prova.

Suponha, agora, que existam razões para se acreditar que essa conclusão não espelha a realidade.
Como interpretar o resultado obtido?
O teste estatístico está indicando que os dados amostrais não apóiam a existência de correlação
populacional. Isto pode ser devido ao fato de que:

a) Não existe realmente correlação entre X e Y na população e o valor r = 0,58 foi um resultado
espúrio.
b) Existe correlação entre X e Y, mas neste experimento não foi possível mostrar esta associação,
provavelmente por causa do pequeno tamanho da amostra.

Para decidir por uma destas alternativas, só há uma solução: aumentar o tamanho da amostra. Se ,
efetivamente, existir correlação e se ela tiver a magnitude observada, um aumento em n ocasionará uma
redução no erro padrão de r, com conseqüente aumento no tcalc, tornando-o, eventualmente, significante do
ponto de vista estatístico. Por outro lado, se realmente não existir correlação entre X e Y, à medida que se
aumenta o tamanho amostral, o valor de r tenderá a zero. Com isso, o tcalc também tenderá a zero, deixando
de ser estatisticamente significativo.

4. AVALIAÇÃO QUALITATIVA DE r QUANTO À INTENSIDADE

Uma vez determinada a existência de correlação na população, pode-se avalia-la qualitativamente


quanto à intensidade, usando-se o critério apresentado na tabela 2.

Tabela 2. Avaliação qualitativa do grau de correlação entre duas variáveis.


|r| A correlação é dita
0 Nula
0|--- 0,3 Fraca
0,3 |----0,6 Regular
0,6 |----0,9 Forte
0,9 |----1 Muito forte
1 Perfeita

5. REQUISITOS AO ESTUDO DA CORRELAÇÃO

Embora não haja necessidade de satisfazer pressuposição alguma para calcular o coeficiente de
correlação entre duas variáveis quantitativas, o teste de significância da correlação somente será realizado
corretamente se:
75

1. Tanto a variável X como Y têm distribuição normal.


2. A variação dos valores de X para cada valor fixo de y é sempre a mesma, isto é, o valor de σ 2x é o
mesmo nos vários níveis de Y (homocedasticidade). No exemplo do tempo de estudo e nota na
prova, isto equivaleria a dizer que, embora a nota esperada (a média) seja diferente para cada tempo
de estudo, o grau de variação em torno dos diferentes valores esperados é o mesmo.
3. Da mesma forma, a variação dos valores de Y ( σ 2y ) é a mesma para todos os valores de X.

Se os dados satisfazem tais pressuposições, o coeficiente de correlação de Pearson é o instrumento mais


adequado para medir a associação entre X e Y; se não satisfazem, não há nenhuma garantia de que esta seja
a medida mais correta de correlação. Daí a importância de se examinar o gráfico de dispersão dos pontos
antes de se efetuar uma análise desta natureza.
Não é demais lembrar que o coeficiente de correlação mede uma associação, não uma relação de causa e
efeito. Assim, se a correlação observada entre X e Y é de –0,44, isto não quer dizer que X determina Y, ou
vice-versa, mas apenas que X e Y estão variando juntos. Deve-se sempre considerar a possibilidade de que
haja outros fatores determinando os níveis tanto de uma quanto de outra variável.
Finalmente, se a amostra for suficientemente grande (por exemplo, n = 900 ), mesmo um coeficiente de
correlação muito baixo (como r = 0,15 ) pode ser estatisticamente muito significativo ( t = 4,55, p < 0,001 ),
embora esteja representando uma associação bastante fraca entre as variáveis. Isso mostra, mais uma vez,
que a significância estatística reflete um julgamento feito para verificar se os dados justificam ou não a
existência de correlação, a qual poderá ser forte, moderada ou fraca dependendo do valor de r.

Exercício 2. Com o objetivo de se estudar a relação entre a temperatura e o tempo de uma reação química,
um certo experimento foi realizado 35 vezes, para 7 temperaturas diferentes e observou-se o tempo de
reação. A seguir apresenta-se os valores das temperaturas, em ºC, e os tempos obtidos, em segundos.

Temperatura Tempo
20 12,3 11,8 11,5 12,1 11,7
30 11,8 11,5 11,4 11,7 11,2
40 10,9 11,2 10,8 10,6 10,3
50 10,4 9,8 9,5 9,9 9,2
60 9,6 9,0 8,7 8,3 9,1
70 9,1 9,3 8,5 8,6 8,3
80 8,4 8,1 8,1 7,7 7,9

Construa um diagrama de dispersão com estes dados, calcule o coeficiente de correlação e realize o teste
para a existência de correlação linear ao nível de 5% de significância.

Exercício 3. Um experimento foi conduzido para se verificar a existência de correlação linear entre medidas
sensoriais da tonalidade da cor do suco de maçã em uma escala de 1 a 12, desde a extremamente clara até
extremamente escura, com o teor de polifenóis do suco.
Analise os resultados abaixo e determine se existe correlação linear significativa. Use α = 10%.
Coloração (X) 2 3,5 5 7 11
Teor de polifenóis g/100ml (Y) 0,02 0,04 0,07 0,09 1,2
76

REGRESSÃO LINEAR SIMPLES

Geralmente se estuda a relação entre duas ou mais variáveis na esperança de que qualquer relação
encontrada possa ser usada no sentido de fazer estimativas ou predições de uma das variáveis particulares. O
coeficiente de correlação só mede a força do vínculo entre duas variáveis aleatórias que se relacionam
linearmente e é incapaz de resolver problemas de predição. Os métodos destinados à manipulação de
problemas de predição são conhecidos como métodos de regressão.
O estudo da regressão se aplica àquelas situações em que há razões para supor uma relação de causa-
efeito entre duas variáveis quantitativas e se deseja expressar matematicamente essa relação. Geralmente
chama-se a variável dependente (ou variável resposta) de Y e a independente (fator, variável explicativa ou
variável preditiva) de X. As expressões a seguir, utilizadas em diferentes linguagens, têm todas basicamente
o mesmo significado:
- Y depende de X (linguagem coloquial)
- Y é função de X (linguagem matemática)
- existe regressão de Y sobre X (linguagem estatística)
A análise de regressão tem por objetivo descrever através de um modelo matemático, a relação
existente entre uma variável dependente Y e uma ou mais variáveis independentes Xi , a partir de n
observações das mesmas. Como o nosso estudo está sendo feito apenas para o caso de duas variáveis,
supondo então X a variável explicativa (independente) e Y a variável explicada ou resposta (dependente),
diremos que Y = f(X).

Dado um conjunto de valores X e Y, construir um modelo de regressão de Y sobre X, consiste em


obter, a partir desses valores, uma equação que melhor represente a relação verdadeira (populacional) entre
essas variáveis. A determinação dos parâmetros dessa equação é denominada ajustamento. O processo de
ajustamento deve partir da escolha da equação através da qual os valores de X explicarão os de Y. Para isso
recorre-se ao diagrama de dispersão. A equação escolhida será aquela que for sugerida pelo conjunto de
pontos dispostos nos diagrama (linear, polinomial, exponencial, etc.).

1. A RETA DE REGRESSÃO DE Y SOBRE X:


Muitas vezes o gráfico de dispersão sugere um relacionamento aproximadamente linear entre as duas
variáveis o que nos leva a um problema de análise de regressão linear simples. Para estabelecer uma lei
matemática entre variáveis que têm uma relação linear, o modelo indicado é o próprio modelo da reta. Esta
reta, chamada de reta de regressão, é representada pela equação
y = α + βx + e
onde e é a variável aleatória correspondente aos erros da variação de Y, e α e β são os parâmetros da reta de
regressão.

O objetivo é obter, a partir dos n pares de dados amostrais, os valores a e b que estimem os
parâmetros α e β. Ou seja, queremos obter a partir de n pares amostrais, a equação de regressão
ŷ = a + b x
que será a estimativa da reta teórica y = α + β x + e

As equações para a obtenção dos valores a e b são:


∑ x∑ y
∑ xy - n S xy
b= =
(∑ x )2
S xx
∑ x2 − n
a = y − bx
77
Tais equações são obtidas pelo método dos mínimos quadrados, ou seja, sob a condição
de minimizar a soma dos quadrados dos desvios entre os valores observados e os respectivos valores
projetados na reta. Esse processo, no entanto, não garante que se tenha obtido a melhor reta ajustada, é
apenas uma propriedade desejada de ajuste da reta.
A reta calculada desta forma é chamada de reta de regressão de y sobre x e indica como X
influencia na variabilidade de Y.
O coeficiente linear (ponto onde a reta corta o eixo y) é dado por a, e b é o coeficiente angular da reta
estimada e indica o quanto varia a média de Y para o aumento de uma unidade da variável X.

É muito importante notar que a reta de regressão de x sobre y não é a mesma reta de regressão de
y sobre x. Para perceber isso basta lembrar que apenas Y é aleatória.

Exemplo 3. Suponha que um engenheiro esteja estudando a relação entre a quantidade (µg / L) de
determinado poluente (S) despejado por uma fábrica em um riacho, e o dano ecológico nesse curso d’água,
medido por um escore de dano. Os valores observados pelo pesquisador estão na tabela 3 e a figura 1,
apresenta o gráfico de pontos correspondente.
Tabela 3. Escores de dano ecológico medido para diferentes concentrações do
poluente S no riacho R.

Quantidade de poluente (µg / L) Escore de dano ecológico


1 3
2 6
3 7
4 10
5 10
6 12

Pelo gráfico pode-se notar uma nítida dependência entre o escore de dano e a concentração do
poluente S na água: tal dependência poderia ser representada por uma linha, possivelmente uma reta,
admitindo-se como fruto do acaso os desvios existentes entre os pontos experimentais e a linha proposta.

Quadro 2. Quadro auxiliar para cálculos.


Nº X X2 Y XY Y2
1 1 1 3 3 9
2 2 4 6 12 36
3 3 9 7 21 49
4 4 16 10 40 100
5 5 25 10 50 100
6 6 36 12 72 144
Total 21 91 48 198 48
Usando as fórmulas acima teremos, a = 2,02 , b = 1,71

Assim, a reta de regressão estimada de y sobre x é: ŷ = 2,02+1,71 x

Verificou-se, então que b = 1,71 graus de dano por µg / L , isto é, para cada acréscimo positivo de um
µg / L na concentração de S parece haver um aumento de 1,7 no índice de dano ecológico. Por outro lado, o
escore de dano esperado quando a concentração for zero é igual a 2,02.
78
2. O COEFICIENTE DE EXPLICAÇÃO:
Para avaliar a "qualidade" do ajuste, podemos verificar o quanto as variações da variável dependente
Y, podem ser explicadas (ou justificadas) por variações da variável independente X, através da função
ajustada. Fazemos isso, calculando o coeficiente de determinação ou explicação R2, dado pela equação:
(∑ x)
2

∑x − n
2
S
R =b
2 2
= b 2 xx
(∑ y )2
S yy
∑ y2 − n
Esse coeficiente é uma medida descritiva da proporção da variabilidade de Y que pode ser explicada
por X, segundo o modelo especificado, e é particularmente importante se vamos usar a reta de regressão para
fazer previsões.
O coeficiente de explicação R2 é um número tal que 0 ≤ R2 ≤ 1

Queremos que R2 seja tão próximo de 1 quanto possível. Quanto mais próximo de 1 estiver o valor de
R2, melhor será a "qualidade" do ajuste. Quando R2 = 1 temos o caso de ajuste perfeito, ou seja, os pontos
amostrais estão todos sobre a reta.

Exemplo 4: Para o exemplo anterior temos R2 = 0,95.


Isto significa que 95% da variabilidade do dano ecológico está sendo explicada pela quantidade
(µg / L) de determinado poluente (S).

3. TESTE DE HIPÓTESES
Devido à variabilidade da amostra, o modelo de regressão ŷ = a + b x obtido com base nos n dados
amostrais, é um dos modelos possíveis para representar a relação existente entre as variáveis na população.

Como há erros aleatórios envolvidos, os valores de a e b obtidos da amostra, não serão iguais aos
parâmetros α e β da população. Assim, para continuar a avaliação do modelo, os mesmos problemas de
estimação e teste de hipóteses sobre parâmetros, podem ser considerados no problema de regressão, com
referência aos parâmetros α e β da reta teórica. A regressão realizada é na realidade, uma estimativa da
verdadeira relação (desconhecida) existente entre as variáveis e, desta forma, a e b são estimativas pontuais
dos dois parâmetros populacionais correspondentes α e β .

Por isso, é de fundamental importância a realização de testes para os parâmetro α e β a partir do valor
de a e b, indicando-nos se esses são ou não bons estimadores.

A seqüência do teste é a mesma dos testes paramétricos já estudados, usando a distribuição "t" de
Student, com n - 2 grau de liberdade.

3.1 - TESTE PARA β :

Passo 1: Hipóteses:
H 0 : β = 0 (não há regressão linear, ou seja, X não ajuda a explicar a variabilidade de Y)

H1 : β ≠ 0 (há regressão linear, ou seja, X contribui para a variabilidade de Y)
79
Passo 2: Fixar α :
Sob H0 e usando as informações amostrais o valor da estatística do teste será dado por:

Syy − b 2Sxx
onde o denominador é o erro padrão do coeficiente b, e s =
2
=QMR e gl = n − 2 .
n−2
b −β
Passo 3: Construir a região crítica. t c = s
SXX

Passo 4: Calcular o valor da estatística, através das informações amostrais, que definirá a decisão.

Passo 5: Conclusão .
a) Se − t α 2 ≤ t c ≤ t α 2 , não se rejeita H 0 . Caso contrário rejeita-se H 0 .
Idem para os casos b) e c).

Exemplo 5: Para os dados do exemplo 3 teremos:

Teste para β :
As hipóteses serão:
H 0 : β = 0 (não há regressão linear, ou seja, X não ajuda a explicar a variabilidade de Y)

H1 : β ≠ 0 (há regressão linear, ou seja, X contribui para a variabilidade de Y)

Sob H0 e usando as informações amostrais o valor da estatística do teste será dado por:
b−β 1,71
tc = = = 8,52
s 0,84
S XX 17,5
2
onde: SYY=54 ; SXX=17,5 ; s =0,71 ; s=0,84

Pela tabela t- Student, para 1% de significância e gl = 4, temos t α / 2 = 4,60 . Como 8,52 > 4,60, rejeitamos
H 0 , ou seja o coeficiente de regressão populacional não deve ser zero; logo, admitimos que existe regressão
de Y sobre X ( α = 0,01 ). Pode-se então concluir que o dano ecológico depende da concentração da
substância S da seguinte foram: para cada acréscimo de um µg / L na concentração desse poluente na água,
espera-se que o escore de dano ecológico aumente 1,71 unidades.

4. REQUISITOS AO USO DA REGRESSÃO LINEAR

Certas exigências devem ser satisfeitas para se realizarem inferências válidas sobre o coeficiente de
regressão linear, embora isso não seja necessário para calcular a e b. Estas exigências são:
1. A variável Y deve ter distribuição normal ou aproximadamente normal.
2. A variação de Y deve ser a mesma em cada valor de x (homocedasticidade). Se não houver
homocedasticidade, será necessário transformar os dados.
3. Os pontos no gráfico devem apresentar uma tendência linear. Caso contrário, a equação que melhor
representará o fenômeno não será uma reta, mas outra linha qualquer. Se os pontos se apresentarem
em curva, pode-se tentar transformar os dados de forma a obter uma reta, ou ajustar uma curva.
4. Os valores de Y foram obtidos ao acaso da população e são independentes uns dos outros.
5. A variável X foi medida sem erro. Satisfazer esta exigência, na prática, é muito difícil. Por isso, o
que se faz é pressupor que os erros ocorridos ao se medir X são desprezíveis ou, pelo menos,
menores dos que os que estão associados à mensuração de Y.
80

Violações das três primeiras pressuposições podem ser contornadas pelo uso de uma transformação
dos dados. Já problemas relacionados com as exigências 4 e 5 são mais difíceis de resolver.

LISTA DE CORRELAÇÃO E REGRESSÃO LINEAR

1. A resistência do papel usado na fabricação de caixas de papelão, y, está relacionada à percentagem da


concentração de madeira de lei na polpa original, x. Sob condições controladas, uma planta pilota fabrica 16
amostras, cada uma sendo proveniente de uma batelada diferente de polpa. Mede – se a resistência à tração.
Os dados são mostrados a seguir.

X Y a) Grafar o diagrama de dispersão


1,0 100 b) Testar a existência da correlação em
1,5 118 α = 5%.
1,5 115 c) Determinar a equação da reta
1,5 106,2 ajustada aos dados amostrais.
2,0 110 d) Grafar a reta no diagrama de
2,2 120 dispersão.
2,4 133,9 e) Calcular o coeficiente de
2,5 120 explicação.R= 83,62%
2,5 123 f) O modelo linear é razoável para tal
2,8 140 estudo? Justificar sua resposta
2,8 145,2 g) Se a resistência do papel é de 121
3,0 140 qual a concentração de madeira de
3,0 144,5 lei necessária?
3,2 159 h) Se a concentração da madeira de lei
é de 2,7, qual será a resistência do
3,3 146,9
papel?
2. O seguintes dados são a saída de corrente contínua de um aerogerador, y, e a velocidade do vento, x.

Velocidade do vento(X) 5 6 3,4 2,7 10 9,7 9,55 3,05 8,15 6,2 2,9 6,35 4,6
Saída da Corrente 1,5 1,8 1,1 0,5 2,2 2,4 2,3 0,6 2,2 1,9 0,7 1,9 1,6
Contínua(Y)
a) Ajustar um modelo de regressão linear simples a esses dados.
b) Testar a existência da regressão a 5% de significância
c) Calcular o coeficiente de explicação R=0,8755
d) Avaliar a reta ajustada.
e) Grafar a reta ajustada no diagrama de dispersão.
f) Se a velocidade do vento for de 7,2 qual será a saída da corrente contínua
3. Doses crescentes de calcário foram adicionadas a um solo e depois determinou-se a percentagem de
anomalias encontradas em células germinativas de trigo plantado nesse solo. Obter uma reta de regressão da
percentagem de anomalias sobre a quantidade de calcário no solo,. Considere α = 1%
81

Quantidade de Calcário 0 1 2 3 4 5
% de anomalias celulares 30 27 22 23 18 16

4. Um artigo em Technometrics, de S.C. Narula e J.F. Wellington(Prediction, linear Regression Vol 19),
apresenta dados de preços de venda e txs anuais de casas.

Preço de Venda/1.000 25,9 29,5 17,9 25,9 29,9 29,9 30,9 28,9 35,9 31,9 31
Txs/1.000 4,9 5,0 4,5 4,6 5,1 3,9 5,9 5,6 5,8 5,3 6,2
a) Construir o diagrama de dispersão.
b) O modelo linear é razoável para tal estudo?
c) Determinar a equação da reta ajustada aos dados amostrais.
d) Avaliar a reta ajustada através da estatística R2.
e) Testar os parâmetros da regressão linear ao nível de 5%
f) Sendo o preço de venda 18.5 qual seria a tx?
g) Estando a tx em 5,2 de quando seria a venda

UNIVERSIDADE ESTADUAL DE MARINGÁ


CENTRO DE CIÊNCIAS EXATAS
DEPARTAMENTO DE ESTATÍSTICA

4. BIBLIOGRAFIA

BUSSAB, W. O., MORETIN, P.A. Estatística básica. 4 ed. São Paulo: Atual. 1987.
CARVAJAR, S.S. R. Elementos de estatística (com aplicações às ciências médicas e biológicas). Rio de janeiro: UFRJ, 1970.
DRAPER, M. SMITH, H. Apllied Regression Analysis. 2 ed. New York: John Willey, 1981.
FUSCO, P. B. Fundamentos estatísticos da segurança das estruturas. São Paulo: Edusp, 1976.
HUTCHINSON, B. G. Princípios de planejamento dos sistemas de transporte urbano. Rio de Janeiro: Guanabara Dois, 1979.
MAGNAN, Jean-Pierre. Les méthodes statistiques et probabilistes en mécanique des sols. Paris: Presses Pontes et Caussées,
1982.
SOARES, José F., FARIAS. Alfredo A., CESAR,Cibele C. Introdução à estatística. São Paulo: LTC,1991.
Udo, M. C. T., COCHIA, E. B. R. Modelos lineares aplicados. Trabalho de pesquisa, DES/UEM, 1991.
82

DISTRIBUIÇÃO NORMAL PADRONIZADA


z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
-3.0 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.0011 0.0011 0.0010 0.0010
-2.9 0.0019 0.0018 0.0018 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014
-2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
-2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
-2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036
-2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048
-2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064
-2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
-2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110
-2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143
-2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
-1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233
-1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
-1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367
-1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
-1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559
-1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681
-1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
-1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985
-1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
-1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
-0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611
-0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867
-0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
-0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451
-0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
-0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121
-0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483
-0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859
-0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
83

DISTRIBUIÇÃO T DE STUDENT

NÍVEL DE SIGNIFICÂNCIA PARA TESTE UNILATERAL


0.005 0.01 0.015 0.02 0.025 0.03 0.035 0.04 0.05 0.1 0.15 0.2 0.25

Graus de NÍVEL DE SIGNIFICÂNCIA PARA TESTE BILATERAL


Liberdade gl 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.10 0.20 0.30 0.40 0.50
1 63.66 31.82 21.20 15.89 12.71 10.58 9.06 7.92 6.31 3.08 1.96 1.38 1.00
2 9.92 6.96 5.64 4.85 4.30 3.90 3.58 3.32 2.92 1.89 1.39 1.06 0.82
3 5.84 4.54 3.90 3.48 3.18 2.95 2.76 2.61 2.35 1.64 1.25 0.98 0.76
4 4.60 3.75 3.30 3.00 2.78 2.60 2.46 2.33 2.13 1.53 1.19 0.94 0.74
5 4.03 3.36 3.00 2.76 2.57 2.42 2.30 2.19 2.02 1.48 1.16 0.92 0.73
6 3.71 3.14 2.83 2.61 2.45 2.31 2.20 2.10 1.94 1.44 1.13 0.91 0.72
7 3.50 3.00 2.71 2.52 2.36 2.24 2.14 2.05 1.89 1.41 1.12 0.90 0.71
8 3.36 2.90 2.63 2.45 2.31 2.19 2.09 2.00 1.86 1.40 1.11 0.89 0.71
9 3.25 2.82 2.57 2.40 2.26 2.15 2.06 1.97 1.83 1.38 1.10 0.88 0.70
10 3.17 2.76 2.53 2.36 2.23 2.12 2.03 1.95 1.81 1.37 1.09 0.88 0.70
11 3.11 2.72 2.49 2.33 2.20 2.10 2.01 1.93 1.80 1.36 1.09 0.88 0.70
12 3.05 2.68 2.46 2.30 2.18 2.08 1.99 1.91 1.78 1.36 1.08 0.87 0.70
13 3.01 2.65 2.44 2.28 2.16 2.06 1.97 1.90 1.77 1.35 1.08 0.87 0.69
14 2.98 2.62 2.41 2.26 2.14 2.05 1.96 1.89 1.76 1.35 1.08 0.87 0.69
15 2.95 2.60 2.40 2.25 2.13 2.03 1.95 1.88 1.75 1.34 1.07 0.87 0.69
16 2.92 2.58 2.38 2.24 2.12 2.02 1.94 1.87 1.75 1.34 1.07 0.86 0.69
17 2.90 2.57 2.37 2.22 2.11 2.02 1.93 1.86 1.74 1.33 1.07 0.86 0.69
18 2.88 2.55 2.36 2.21 2.10 2.01 1.93 1.86 1.73 1.33 1.07 0.86 0.69
19 2.86 2.54 2.35 2.20 2.09 2.00 1.92 1.85 1.73 1.33 1.07 0.86 0.69
20 2.85 2.53 2.34 2.20 2.09 1.99 1.91 1.84 1.72 1.33 1.06 0.86 0.69
21 2.83 2.52 2.33 2.19 2.08 1.99 1.91 1.84 1.72 1.32 1.06 0.86 0.69
22 2.82 2.51 2.32 2.18 2.07 1.98 1.90 1.84 1.72 1.32 1.06 0.86 0.69
23 2.81 2.50 2.31 2.18 2.07 1.98 1.90 1.83 1.71 1.32 1.06 0.86 0.69
24 2.80 2.49 2.31 2.17 2.06 1.97 1.90 1.83 1.71 1.32 1.06 0.86 0.68
25 2.79 2.49 2.30 2.17 2.06 1.97 1.89 1.82 1.71 1.32 1.06 0.86 0.68
26 2.78 2.48 2.30 2.16 2.06 1.97 1.89 1.82 1.71 1.31 1.06 0.86 0.68
27 2.77 2.47 2.29 2.16 2.05 1.96 1.89 1.82 1.70 1.31 1.06 0.86 0.68
28 2.76 2.47 2.29 2.15 2.05 1.96 1.88 1.82 1.70 1.31 1.06 0.85 0.68
29 2.76 2.46 2.28 2.15 2.05 1.96 1.88 1.81 1.70 1.31 1.06 0.85 0.68
30 2.75 2.46 2.28 2.15 2.04 1.95 1.88 1.81 1.70 1.31 1.05 0.85 0.68
40 2.70 2.42 2.25 2.12 2.02 1.94 1.86 1.80 1.68 1.30 1.05 0.85 0.68
50 2.68 2.40 2.23 2.11 2.01 1.92 1.85 1.79 1.68 1.30 1.05 0.85 0.68
60 2.66 2.39 2.22 2.10 2.00 1.92 1.84 1.78 1.67 1.30 1.05 0.85 0.68
120 2.62 2.36 2.20 2.08 1.98 1.90 1.83 1.77 1.66 1.29 1.04 0.84 0.68

2.58 2.33 2.17 2.05 1.96 1.88 1.81 1.75 1.64 1.28 1.04 0.84 0.67

Vous aimerez peut-être aussi