Vous êtes sur la page 1sur 60

Ministério da Educação

Universidade Tecnológica Federal do Paraná


Coordenação de Química PR
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

CURSO D E QUÍ M I C A

DISCIPLINA DE ESTATÍSTICA

PROFESSOR MARCIO BENNEMANN

ALUNO(A):.....................................................................................................

PATO BRANCO, 2009.

COELM – Estatística – Marcio Bennemann1


PROGRAMA
ITEM DA EMENTA/BASE TECNOLÓGICA CONTEÚDO PROGRAMÁTICO/HABILIDADES
Noções de Estatística Descritiva Medidas de posição
Medidas de dispersão
Representações gráficas
Probabilidade Variáveis Aleatórias
Distribuição Binomial
Distribuição Normal
Teoria da Amostragem Técnicas de amostragem
Cálculo do tamanho da amostra
Estimação de Parâmetros Intervalo de Confiança pa Média
Intervalo de Confiança para Proporção
Correlação Correlação Linear

Regressão Regressão linear


Testes de Hipóteses Teste t
Teste Qui-quadrado
ANOVA

BIBLIOGRAFIA
DOWNING, D. & CLARK, J. Estatística Aplicada. SP, Saraiva, 2000.
FONSECA, J. S. Et alii. Estatística aplicada. Ed. Atlas, São Paulo, 1976.
BIBLIOGRAFIA COMPLEMENTAR
KUME, Hiltoshi. Métodos Estatísticos para Melhoria da Qualidade, Ed. Gente, SP, 1993
VIEIRA, S. et alii. Estatística Experimental. Ed. Atlas, São Paulo, 1989.

COELM – Estatística – Marcio Bennemann2


NOÇÕES DE ESTATÍSTICA DESCRITIVA

Para entender um conjunto de dados relevantes a seu trabalho, você deve trabalhar estes dados
para transformá-los em informações, para compará-los com outros dados, ou ainda para julgar sua
adequação a alguma teoria.
A Estatística Descritiva objetiva descrever o comportamento dos dados (informações) por meio da
tabulação dos dados, da identificação de valores representativos do conjunto, além de representações
gráficas.

Vejamos um exemplo:

As indústrias acompanham a produção por meio de amostras onde são verificadas as dimensões do
produto, sua resistência, possíveis defeitos, etc.
Considere uma Indústria de Arruelas cujo diâmetro externo deveria ser de 32mm. Ao inspecionar
uma amostra, chegaremos a medidas com alguma oscilação em torno dos 32mm esperados. Considere as
seguintes medidas: Diâmetro (mm)

31,8 33,0 31,6 30,7 31,8 31,7 33,0 31,9


31,2 30,7 31,0 31,7 31,8 33,2 31,0 31,7
32,1 31,9 30,9 31,8 32,8 32,5 32,3 32,4
32,5 32,7 31,4 32,1 31,9 33,4 32,5 31,8
32,7 31,3 31,5 31,8 31,9 30,2 33,2 32,5

Para melhorar a interpretação destas medidas podemos organizá-las por intervalos:

Menor diâmetro = 30.7


Maior diâmetro = 33.4

Resultados da Amostragem/09 Diâmetro das Arruelas na amostragem/03


Fonte: 14
Diâmetro (mm) Nº de Arruelas 12
30,2 |--- 30,7 2
10
Nº de Arruelas

30,7 |--- 31,2 4


31,2 |--- 31,7 8 8

31,7 |--- 32,2 12 6


32,2 |--- 32,7 7
4
32,7 |--- 33,2 6
33,2 |--- 33,7 1 2

Total 40 0
Dep. Controle de Prod.
30,2 |--- 30,7 30,7 |--- 31,2 31,2 |--- 31,7 31,7 |--- 32,2 32,2 |--- 32,7 32,7 |--- 33,2 33,2 |--- 33,7

Diâm etro m m

COELM – Estatística – Marcio Bennemann3


Através da tabela e do gráfico temos uma visão melhor dos dados, onde acompanhamos as
quantidades de arruelas em cada intervalo de medida, onde ocorre a maior incidência, como se distribui a
variação nas medidas acima e abaixo do valor esperado.
Esta visão panorâmica (descrição dos dados) nos leva as primeiras conclusões (preliminares)
quanto ao desempenho da indústria com relação a capacidade de produzir arruelas cujo diâmetro seja de
32mm.

Podemos ainda obter o diâmetro médio da amostra:

x = média x = 31,9mm (está abaixo do previsto 32mm) (Seria realmente uma falha na produção?)

Observamos que os diâmetros oscilam com relação a média de 31,9mm. Como cada arruela da
amostra apresenta uma oscilação própria em torno do 31,9mm , necessitamos de uma medida que traduza
(generalize) todas as variações. Esta é uma medida de dispersão (variação em torno da média) que
chamaremos de Desvio Padrão

s = desvio padrão s = 0,747mm

A medida que estabelecemos valores representativos do conjunto, temos mais subsídios para
descrever a produção.

COMO OBTER A MÉDIA?

O cálculo da média se resume a soma dos dados dividida pelo nº de dados.

Mesmo sendo um cálculo extremamente simples, podemos simplificá-lo ainda mais através do uso
do programa de Estatística contido nas calculadoras científicas.

Identifique em sua calculadora:

Stat junto a techa AC ou SD em MODE . ou ainda SD em MODE 2 Dependendo do


modelo de sua calculadora.
DATA juntamente com M+ faz o registro dos dados
x juntamente com X-M ou junto ao 7 ou ainda junto ao 1 (Determina a média dos valores
cadastrados)

Por exemplo: Calcular a média dos seguintes valores:


45; 48; 46; 45; 49; 41.
Defina o programa de Estatística em sua calculadora;
Digite cada nº seguido de DATA
Clique em x e você obterá o valor da média.

EXERCITE ESTE PROCEDIMENTO:

1- Qual é a média para a velocidade dos carros no Km 000 da Rodovia BR 000?


(Km/h) 117; 121; 100; 95; 110; 124; 110; 120; 114; 128; 105; 102; 110; 108; 98; 87; 100

2- Qual é a resistência média a tração dos cabos de Aço 3/8’da marca Z?


(Kgf/cm²) 3200; 3180; 3400; 3320; 3170; 3100; 3290; 3310; 3360; 3290.

COELM – Estatística – Marcio Bennemann4


Dispersão

Anteriormente quando tratamos do diâmetro das arruelas, observamos uma variação em torno da
média que chamamos de Desvio Padrão.

O QUE SIGNIFICA O DESVIO PADRÃO E COMO PODEMOS CALCULÁ-LO?

O Desvio Padrão pode ser entendido como a unidade estatística que mede a dispersão dos dados,
onde dispersão é entendida como variação em torno da média.

Para calcular o Desvio Padrão, verificaremos qual é a diferença entre cada número e a média do
conjunto. Em seguida calcularemos a média destas diferenças.

Ex.: Tempo de execução da atividade A (Parafusar as cantoneiras) no processo de fabricação de


um fogão.
(segundos/fogão/funcionário)
80; 79; 80; 78; 80; 82; 81.
O tempo médio é de 80 segundos, e as variações em torno da média são:
0; -1; 0; -2; 0; 2; 1.
Se calcularmos a média destas variações chegaremos a zero pois a soma é nula, no entanto é
evidente que a variação não pode ser zero.
A soma se anulou pois temos valores positivos e negativos, o que acontece sempre quando
comparamos os valores com a média.
Para eliminar este probleminha (soma nula), vamos elevar cada diferença ao quadrado, assim
teremos apenas números positivos e a soma não será mais nula.
0² ; (-1)²; 0²; (-2)²; 0²; 2²; 1².
Passamos a Ter uma soma = 10
Fazendo a média com esta soma teremos: 10/7 = 1,429 (segundos ao quadrado)
Para voltarmos a unidade segundo vamos extrair a raiz quadrada desta média: √ 1,429 = 1,195s.

Concluímos que os funcionários levam em média 80 segundos para fazer a operação A com
uma variação média de 1,195 segundos em torno de 80s.

x x-x (x - x)²
80 80 - 80 0²
79 79 - 80 (-1)²
80 80 - 80 0² 10/7 = 1,428571
78 78 - 80 (-2)²
80 80 - 80 0² raíz =1,1955
82 82 - 80 2²
81 81 - 80 1²
x = 80 total = 10

COELM – Estatística – Marcio Bennemann5


Exercícios:
3- Calcule a média e o desvio padrão:
a)Nº de produtos defeituosos produzidos em cada uma das máquinas da Indústria I em 2009.
Prod. Defeituosos / máquina x –x ( x – x )2
58
62
40
49
60
52
35
47
40
70
35

b)Consumo de combustível (Km/l) dos veículos da frota da Transportadora T(jan/09).


Consumo (Km/l)
13
15
14
12
10
15
12
12
12
14

O Desvio Padrão calculado como fizemos até aqui é chamado de Desvio Padrão
Populacional,
porque foi calculado com todos os elementos de uma população.
No 1º caso (tempo de execução da atividade) tínhamos os tempos de todos os funcionários
(população de funcionários da empresa).
No 2º caso (produtos defeituosos por máquina) tínhamos todas as máquinas da empresa
(população das máquinas)
No 3º caso (consumo de combustível) tínhamos o consumo de todos os veículos da frota
(população de veículos da empresa)

O Desvio Padrão Populacional é representado pela letra grega sigma minúsculo (σ ou σn ).

Quando calculamos o desvio padrão a partir de uma amostra dos dados, chamamos de Desvio
Padrão Amostral e representamos por ( s ou σ n-1). (Uma amostra é apenas uma parte da
população)
Calculando o desvio padrão amostral estamos estimando o desvio para toda a população, por isso
o cálculo difere um pouco.
Faremos a média da amostra
Subtrairemos a média de todos os valores da amostra
Elevaremos os resultados ao quadrado
Somaremos os quadrados
A divisão será por ( n – 1 )
Extrai a raiz quadrada.

COELM – Estatística – Marcio Bennemann6


Obs.: A divisão será por (n-1) porque a média utilizada foi a média amostral e quando
introduzimos em uma amostra uma estimativa, perdemos um grau de liberdade. (Tínhamos n valores reais
da população, eram n graus de liberdade, subtraímos a média amostral, perdemos um grau de liberdade,
ficamos com (n – 1) ).

Exemplo:
Registramos a Tensão elétrica em um terminal da Indústria I.
(Medidas de 5 em 5 minutos) Fizemos uma amostragem:
(V) 127; 127; 127; 125; 125; 124; 126; 127; 128; 125.
Qual foi a tensão média e qual foi o desvio padrão?
Média = 126,1 V

Para calcular o desvio:


[(127-126,1)²+(127-126,1)²+(127-126,1)²+(125-126,1)²+(125-126,1)²+(124-126,1)²+(126-126,1)²
+(127-126,1)²+(128-126,1)²+(125-126,1)²] / (10 – 1 ) = 1,655556
Extrai a raiz quadrada s = 1,28668V

LEMBRE-SE

Desvio Padrão Populacional (σ ou σn ) divide por n e representa o desvio da população;

Desvio Padrão Amostral (s ou σ n-1 ) divide por (n-1) e representa uma estimativa do desvio
da população.

Exercício:

04 – Calcule a média e o desvio padrão:


a)Amostragem dos pesos das chapas de alumínio ( m x n ) com 1mm de espessura:
(Kg) 1,245; 1,268; 1,291; 1,198; 1,199; 1,204; 1,214; 1,225

b)Tempo de uso dos motores (todos)da linha de produção da Indústria I (horas).


3500; 4200; 2890; 2500; 3100; 3200; 4100; 3950.

c)Amostragem do percetual de álcool na gasolina:


22%; 21%; 20%; 22%; 23%; 22%; 20%; 25%.

COELM – Estatística – Marcio Bennemann7


Assim como a média, o desvio padrão também pode ser obtido no programa de estatística das
calculadoras científicas.
Para isso basta cadastrar os valores em DATA (M+) e em seguida clicar em “s” ( σ n − 1 ) para
desvio padrão amostral ou “σ” ( σ n ) para desvio padrão populacional.

OBS.: Certifique-se de zerar a memória estatística de sua calculadora antes de iniciar um novo
cálculo.

Exercícios:

05-Através da calculadora determine o valor da média e do desvio padrão:


a)Teste de durabilidade dos pneus P – Resultados amostrais em 1000Km.
34,3 37,9 30,0 32,5 30,8 30,1 35,3 34,1 34,6 37,0
32,1 37,8 34,5 33,4 32,8 33,7 34,2 38,1 33,8 40,5
35,6 39,0 37,5 31,1 33,2 34,1 34,2 34,8 39,5 33,5

b)Teste de frenagem com as pastilhas PP. (percurso de frenagem – amostragem a 80Km/h)


63,4 66,8 61,7 63,1 64,4
61,8 63,0 62,1 61,2 69,1
71,0 63,0 64,2 61,2 66,7
60,3 58,9 60,3 62,2 68,7

c)Horas de atraso acumuladas no mês de agosto/05 pelos funcionários da Indústria R.


2 3 2 3 1 2
2 4 4 3 1 1
0 2 0 2 4 2
2 2 1 2 1 1

d)Despesa com substituição de peças dos veículos da frota da cooperativa Coamo (R$/veículo)
213,08 100,06 174,50 115,94 214,78 177,24 178,91 158,00
182,33 28,00 146,55 139,09 270,52 114,25 22,52 174,16
205,39 75,89 0,00 0,00 178,89 216,87 89,68

e)Amostragem do diâmetro (mm) dos eixos produzidos na Indústria T.


11,96 11,89 11,98 11,97 11,94 11,97 11,95
12,06 11,98 11,90 12,07 11,99 11,94 11,99
11,99 12,06 11,98 11,96 12,03 11,96

COELM – Estatística – Marcio Bennemann8


REPRESENTAÇÃO GRÁFICA

Existem diversos modelos de gráficos. Para escolher o mais adequado aos dados que dispomos
devemos seguir a seguinte orientação:

Tabelas que envolvem datas (série temporais) devem preferencialmente ser representadas com
gráficos de linhas.

Tabelas que envolvem lugares (séries geográficas) devem preferencialmente ser representadas
com gráficos de colunas ou setores (pizza).

Tabelas que descrevem um tema subdividindo-o em itens (série específica) devem


preferencialmente ser representadas com gráficos de colunas ou setores.

Informações coletadas em laboratório que resultam em pares ordenados (x;y) devem ser
representadas com Diagramas de Dispersão

As dimensões do gráfico devem se adequar ao nosso campo de visão, de modo que deve se
apresentar em formato retangular onde a altura corresponderá a aproximadamente 80% da largura
(compare seu gráfico com as dimensões da tela do micro)

O TÍTULO do gráfico deverá responder a três perguntas:

O que foi pesquisado?


Onde foi pesquisado?
Quando foi pesquisado?

Utilizaremos o Excel ou o BrOffice para representar graficamente os dados coletados. Para isso
devemos digitar uma tabela com as informações que desejamos apresentar.
Despesas da Indústria T por setor-P. Branco - 09:
Setor Despesas R$
Administrativo 16500,00
Manutenção 8500,00
Comercialização 10100,00
Markting 7500,00
Produção 32400,00
Fonte: Dep. Financeiro

De s pe s as da Indús tria T por Se tor P. B. 09.

35000
30000
25000
20000
R$
15000
10000
5000
0
Adm Man. Com. Mark. Prod.

Setor

COELM – Estatística – Marcio Bennemann9


Exercício:

6- Represente graficamente:
a) Defeitos presentes na amostragem
da produção da Indústria R-PB.-09.
Tipo de Defeito Nº de peças def.
Deformação 85
Coloração Irreg. 54
Trincas 23
Ranhuras 21
Outros 17
Fonte: Dep. Produção

b)Durabilidade (km) dos Pneus – R (neste gráfico as colunas devem ficar juntas devido a seqüência dos
Amostr. 09 SP. intervalos)
Durabilidade (Km) Nº de Pneus
20000 |--- 22000 5
22000 |--- 24000 19
24000 |--- 26000 38
26000 |--- 28000 48
28000 |--- 30000 35
30000 |--- 32000 15
32000 |--- 34000 7
Total 167

Fonte: Dep. Produção

c) Reproduza o gráfico de setores abaixo:

Consumo de Energia em Florianópolis (média 1980-96)

d)Represente graficamente os dados da tabela abaixo:


Faturamento líquido da Indústria Química Brasileira (1990 – 2006)Em US$ bilhões

Segmentos 1990 92 94 96 98 00 02 03 04 05 06 %
a.a.

Produtos químicos de uso 19,0 17,4 19,2 19,9 18,5 22,8 19,4 24,1 33,0 39,4 45,4 5,6
industrial

Produtos Farmacêuticos 2,7 3,0 5,0 7,6 8,7 6,7 5,2 5,6 6,8 9,2 10,9 9,1

COELM – Estatística – Marcio Bennemann10


Hig. pessoal, perf. e 1,6 1,7 2,4 4,2 4,3 3,4 2,8 3,1 3,9 5,5 6,9 9,6
cosméticos

Adubos e fertilizantes 2,3 1,7 2,2 3,0 2,9 3,0 3,3 4,3 5,6 5,3 5,6 5,7

Sabões e detergentes (1) 2,0 2,0 2,0 2,8 3,1 2,3 2,1 2,1 2,7 3,9 4,6 5,3

Defensivos agrícolas 1,1 0,9 1,4 1,8 2,6 2,5 1,9 3,4 4,9 4,2 3,9 8,2

Tintas, esmaltes e vernizes 1,7 1,7 1,8 2,0 2,0 1,5 1,1 1,3 1,5 1,9 2,1 1,3

Outros 1,4 1,5 1,6 1,5 1,7 1,4 1,5 1,6 1,8 2,0 2,3 3,2

TOTAL 31,8 29,9 35,6 42,8 43,8 43,6 37,3 45,5 60,2 71,6 81,6 6,1

Fontes: ABIQUIM e associações dos segmentos. (1) O faturamento de 1990 a 1994 foi estimado pela ABIQUIM em US$ 2 bilhões.

e) Relação entre a dosagem da substância SS e o período de sono em cobaias.

Dosagem(mg/Kg) Horas de sono


2 5
2,4 7
2,9 9
3,3 13
3,6 14
4,1 15
4,7 16

f) Relação entre a dosagem da substância SS e o período de sono em cobaias segundo o gênero..

Dosagem(mg/Kg) Horas de sono(machos) Horas de sono(Fêmeas)


2 5 5,6
2,4 7 7,9
2,9 9 10
3,3 13 14,2
3,6 14 16
4,1 15 17
4,7 16 18,2

COELM – Estatística – Marcio Bennemann11


Ministério da Educação
Universidade Tecnológica Federal do Paraná
Coordenação de Química PR
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

Trabalho – 01 entregar em ......../.........../.............


Aluno(a):.............................................................................................................

1- Represente graficamente as informações abaixo: (imprimir e colar)


a)Gráfico de setores:
Faturamento líquido por segmento em 2007. consulte:
http://www.abiquim.org.br/conteudo.asp?princ=ain&pag=estat
b)Gráfico Histograma:
Nº de municípios segundo a população no PR.
http://www.ibge.gov.br/home/estatistica/populacao/indicadores_sociais_municipais/tabela1d.shtm
c) Gráfico de colunas
Potencial total de poluição industrial....
http://www.ibge.gov.br/home/presidencia/noticias/noticia_visualiza.php?id_noticia=1154&id_pagina=
d)Você já coletou dados no laboratório nas aulas de física. Represente-os graficamente.
2- Calcule a média e o desvio padrão:
a)Consumo de energia elétrica em sua residência nos últimos seis meses:
158 172 169 182 170 150

b)Nº de atendimentos (televendas) na empresa X nos últimos 10 dias:


45 74 55 54 80 65 54 58 60 64

c)Nº de interrupções (anuais) no fornecimento de energia da Hidrelétrica HH desde o início de sua operação:
2 1 0 0 3 2 1

COELM – Estatística – Marcio Bennemann12


PROBABILIDADE

Através da Probabilidade é possível acompanhar a produção, identificando a normalidade ou não


dos acontecimentos, possíveis ocorrências e valores esperados.

DISTRIBUIÇÃO BINOMIAL

Trata-se do estudo de situações onde existem apenas duas possibilidades (sucesso ou fracasso) .
Neste estudo faremos a descrição de todas as possíveis ocorrências (conjuntos de sucessos e/ou
fracassos).
Exemplo:
Uma indústria mantém um controle de produção com amostragens diárias de 4 peças. Nestas
amostragens, o que o inspetor de produção poderá encontrar?
Quatro perfeitas Três perfeitas Duas perfeitas Uma perfeita Nenhuma perfeita

Indicando perfeita (sucesso) por “P” e defeituosa (fracasso) por “D”, teremos:
PPPP PPPD PPDD PDDD DDD
PPDP PDPD DPDD
PDPP DPPD DDPD
DPPP PDDP DDDP
DPDP
DDPP
Uma opção Quatro opções Seis opções Quatro opções Uma opção

Na tabela estão todos os possíveis resultados da inspeção, portando a tabela apresenta 100%.
As probabilidades individuais não podem ser as mesmas já que uma empresa deve produzir mais
peças perfeitas do que peças defeituosas. Vamos admitir que historicamente (ao longo do tempo) a
Indústria apresente 3% de defeitos em sua produção ( o que nos leva a 97% de peças perfeitas).
Qual é a probabilidade de ocorrer PPPP?
Perfeita e Perfeita e Perfeita e Perfeita (em probabilidade a interpretação “e” nos indica
multiplicação)
PPPP = 0,97x0,97x0,97x0,97 = 0,974 = 0,88529 (88,529%)
PPPD =.......................................................................................(4x)...............................
PPDD =.......................................................................................(6x)..............................
PDDD =.......................................................................................(4x).............................
DDDD =......................................................................................
As quantidades 1 ; 4; 6; 4; 1, podem ser obtidas por meio da combinação Cnx = n! / [x!(n-x)!]
Onde n representa o tamanho da amostra e x o número de sucessos.

C44 = 1 ; C41 = 4 ; C42 = 6 ; C43 = 4 ; C40 = 1.

Chamando de “p” a probabilidade do sucesso (no ex. p = 0,97) e de (1-p) a probabilidade do


fracasso ( no ex. 0,03) podemos generalizar o cálculo com a seguinte expressão:

P(x) = probabilidade de ocorrer x sucessos

P(x) = Cnx . px . ( 1 – p )n – x

Na amostra do exemplo:
P(4)= C44 . 0,974 . 0,030 = 0,88529 (88,529%); P(3)=..................................................................

P(2)=........................................................... P(1)=..................................................................
P(0)=...........................................................

COELM – Estatística – Marcio Bennemann13


Outro Exemplo:
Uma Indústria de Disquetes detectou 2% de defeitos em sua produção. Se estes disquetes são
comercializados em caixas com dez unidades, quando adquirimos uma caixa destes disquetes, qual é a
probabilidade de encontrarmos:
a)Todos perfeitos? P(10) = C1010 . 0,9810 . 0,020 1 . 0,81707 . 1 = 0,81707 (81,707%)

b)Nove perfeitos? P(9) = C109 . 0,989 . 0,021 10 . 0,83375 . 0,02 = 0,16675 (16,675%)

c)Oito perfeitos? P(8) = C108 . 0,988 . 0,022 45 . 0,85076 . 0,00040 = 0,01531 (1,531%)

d)Sete perfeitos?............................................................................................................................(0,08334%)

e)Seis perfeitos?............................................................................................................................(0,00298%)

f)Cinco perfeitos?..........................................................................................................................(0,00007%)

g)Quatro perfeitos?...................................................................................................................(1,24 . 10-6 %)

h)Três perfeitos?.......................................................................................................................(1,45 . 10-8 %)

i)Dois perfeitos?......................................................................................................................(1,11 . 10-10 %)

j)Um perfeito?.........................................................................................................................(5,02 . 10-13 %)

k)Nenhum perfeito?................................................................................................................(1,02 . 10-15 %)

A medida que aumentou os defeitos na amostra, a probabilidade diminuiu significativamente,


onde observamos que quatro defeitos ou mais apresentam uma probabilidade insignificante.

Na distribuição acima, identifique a probabilidade de encontrarmos:


a)No máximo dois defeitos:
(não podemos ter mais que dois defeitos na amostra, ou seja deveremos ter no mínimo oito disquetes
perfeitos)
P(10) dez perfeitos
P(9) nove perfeitos
P(8) oito perfeitos
Estas são as opções nas quais aparecem no máximo dois defeitos.
P(10) + P(9) + P(8) = 99,913%

b)Três ou mais defeitos:


(serão no máximo sete perfeitos)
P(7) + P(6) + P(5) + P(4) + P(3) + P(2) + P(1) + P(0) = 0,087%
Também poderia ser: 100% - [P(10)+P(9)+P(8)] = 0,087%

c)Pelo menos um defeito:


(só não pode ser todos perfeitos)
100% - P(10) = 18,293%

d)Três defeitos:
(corresponde a sete perfeitos)
P(7) = 0,08334%

COELM – Estatística – Marcio Bennemann14


Exercícios:
8- Sabendo que um certa máquina produz 93% de peças perfeitas, ao extrairmos uma amostra
aleatória de 8 peças da produção desta máquina, qual é a probabilidade de encontrarmos:
a)Uma peça defeituosa?

b)No máximo uma peça defeituosa?

c)Pelo menos uma peça defeituosa?

9- Em média 3% dos artigos produzidos por um certo fabricante são defeituosos. Qual é a
probabilidade de, em uma amostra com 10 artigos:
a)Dois serem defeituosos?

b)Pelo menos três serem defeituosos?

10-De um grande número de artigos produzidos em série, um em dez é defeituoso. Calcule a


probabilidade de que uma amostra aleatória de 20 conterá:
a)Exatamente dois artigos defeituosos;

b)Pelo menos dois artigos defeituosos.

11-Um plano de inspeção aleatória funciona como se segue. Toma-se uma amostra aleatória de
tamanho dez. Se a amostra não apresentar defeitos, aceita-se toda a produção da qual foi tirada. Se mais
de um é defeituoso, rejeita-se a produção. Se exatamente um for defeituoso, toma-se outra amostra de
tamanho dez, e aceita-se a produção toda apenas se esta segunda amostra não contiver defeitos. Se uma
produção com 5% de defeitos é testada por este plano, qual é a probabilidade de que:
a)A produção seja aceita na primeira amostragem?

b)A produção seja rejeitada na primeira amostragem?

c)A produção seja aceita na segunda amostragem?

d)A produção seja aceita? (pode ser na primeira ou na segunda amostragem , tem duas chances)

e)A produção seja rejeitada?

12- Numa pesquisa da produção diária de 400 máquinas, fazendo os mesmos componentes, 4
artigos escolhidos ao acaso da saída de cada máquina foram minuciosamente inspecionados. O número m
de máquinas produzindo f artigos defeituosos foi:
f ( nº de defeitos por máquina) 0 1 2 3 4
m(nº de máquinas) 325 69 5 1 0
Estabeleça a distribuição Binomial que representa esta amostragem.
(calcule o percentual de defeitos na produção e determine P(4); P(3); P(2); P(1); P(0).
COELM – Estatística – Marcio Bennemann15
DISTRIBUIÇÃO NORMAL

2
 x− µ 
 
 σ 
1 −
f ( x) = e 2

2π σ

A Distribuição Normal trata da probabilidade de variáveis chamadas contínuas (variáveis que


necessitam de uma unidade de medida, por isso não podem ser enumeradas). Por exemplo se a variável
representa a durabilidade de um pneu, poderia estar no intervalo de 20.000Km a 35.000Km, e neste
intervalo existem infinitas medidas possíveis, portanto não podem ser escritas uma a uma. Além disso, a
Distribuição Normal tem um padrão onde existe uma concentração de valores próximos a média e a
medida que nos afastamos da média, cada vez menos valores são observados.
Considere o seguinte exemplo:
Selecionando um grande número de parafusos cujo diâmetro previsto seja de 12mm, é muito
provável que nem todos os parafusos tenham exatamente 12mm, existirá alguma variação acima e abaixo
de 12mm, mas poderíamos considerar normal esta variação se a grande maioria dos parafusos estivesse
muito próximo de 12mm e diâmetros mais distantes, acima ou abaixo, seriam mais raros.
A Distribuição Normal representaria esta situação assim:

Diâm e tro dos parafus os

0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
11,85 11,9 11,95 12 12,05 12,1 12,15
mm

Esta é a chamada curva da Distribuição Normal, é uma curva simétrica tendo no centro a média da
variável.
Na curva estão representados todos os diâmetros verificados e a quantidade de parafusos em cada
diâmetro, portanto 100% dos dados estão representados entre a curva e a reta (indicação do diâmetro).
Como entre a curva e a reta temos uma superfície, podemos dizer que a área entre estes dois elementos
representa 100% da produção de parafusos, segundo seus diâmetros.

COELM – Estatística – Marcio Bennemann16


Agora se desejarmos calcular a probabilidade e encontrar um parafuso com diâmetro em um
determinado intervalo ( por exemplo entre 11,95mm e 12,05mm), basta calcular a área definida entre
estas duas medidas.

Diâm e tro dos parafus os

0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
11,85 11,9 11,95 12 12,05 12,1 12,15
mm

b
O cálculo de área em regiões curvas se faz através da Integral ∫ f ( x) dx onde a e b são os limites
a

que definem o intervalo.


Este cálculo pode ser simplificado usando uma tabela da distribuição normal padronizada, onde
através da variável reduzida “z” podemos obter todas as áreas que desejarmos.

x− µ
A variável reduzida z = x é o ponto que desejamos calcular;
ο
µ é a média dos dados;

σ é o desvio padrão

Na tabela o valor de “z “está distribuído na coluna da esquerda (com uma casa decimal) e na
primeira linha ( com a segunda casa decimal)

Por exemplo, z = 1,36 ( 1,3 na coluna da esquerda e 0,06 na primeira linha).


No interior da tabela a leitura é = 0,0869 (8,69%) que representa a área da cauda da
curva, alem do valor 1,36.

04 5
,

0,
4

03 5
,

0,
3

02 5
,

0,
2

01
, 5

0,
1

0,
0 5

3
- 2 ,
- 7 2 ,
- 4 2 ,
- 1 1 ,
- 8 1 ,
- 5 1 ,
- 2 0,
-9 0,
-6 0,
-3 0 03
, 06
, 09
, 1 2
, 1 5
, 1 8
, 2 ,
1 2 ,
4 2 ,
7 3

COELM – Estatística – Marcio Bennemann17


DISTRIBUIÇÃO NORMAL PADRÃO (z)

COELM – Estatística – Marcio Bennemann18


Exemplo:

Uma máquina produz componentes de diâmetro médio 1,535cm com desvio padrão de
0,005cm. Os diâmetros são tomados como distribuídos normalmente.
Calcule a probabilidade de selecionarmos aleatoriamente um componente com diâmetro:

a)Superior a 1,543cm;
sendo x o diâmetro teremos: P( x > 1,534cm) = ????
a variável reduzida z = (1,543 – 1,535) / 0,005 = 1,60
04 5
,

0,
4

03 5
,

0,
3

02 5
,

0,
2

01
, 5 5,48%
0,
1

0,
0 5

3
- 2 ,
- 7 2 ,
- 4 2 ,
- 1 1 ,
- 8 1 ,
- 5 1 ,
- 2 0,
-9 0,
-6 0,
-3 0 03
, 06
, 09
, 1 2
, 1 5
, 1 8
, 2 ,
1 2 ,
4 2 ,
7 3

1,535
1,543

b)Inferior a 1,522cm;
P( x < 1,522cm) = ???
Z = (1,522 – 1,535)/0,005 = - 2,6
04 5
,

0,
4

03 5
,

0,
3

02 5
,

0,
2

0,47% 01
, 5

0,
1

0,
0 5

1,535
3
- 2 ,
- 7 2 ,
- 4 2 ,
- 1 1 ,
- 8 1 ,
- 5 1 ,
- 2 0,
-9 0,
-6 0,
-3 0 03
, 06
, 09
, 1 2
, 1 5
, 1 8
, 2 ,
1 2 ,
4 2 ,
7 3

1,522
c)Entre 1,531cm e 1,540cm;
P( 1,531 < x < 1,540 ) = ??

Z = (1,531 – 1,535)/0,005 = - 0,80


Z2 = (1,540 – 1,535)/0,005 = 1,00
04 5
,

0,
4

03 5
,
62,94%
15,87%
0,
3

02 5
,

21,19% 0,
2

01
, 5

0,
1

0,
0 5

3
- 2 ,
- 7 2 ,
- 4 2 ,
- 1 1 ,
- 8 1 ,
- 5 1 ,
- 2 0,
-9 0,
-6 0,
-3 0 03
, 06
, 09
, 1 2
, 1 5
, 1 8
, 2 ,
1 2 ,
4 2 ,
7 3

1,531 1,540

COELM – Estatística – Marcio Bennemann19


Exercícios:
12- O tempo de duração das lâmpadas produzidas na indústria LL é em média de 2.850horas com desvio
padrão de 120 h . Se a durabilidade é normalmente distribuída, qual é a probabilidade de encontrarmos
uma lâmpada LL com durabilidade:
a)Inferior a 2950 h? b)Inferior a 2.650 h?

c)Superior a 2.700 h? d)Superior a 3.000 h?

f)Entre 2.800h e 2.950h? g)entre 2.920h e 2.990h?

13- Peças são fabricadas para terem 18 polegadas de comprimento, mas são aceitáveis nos limites
17 15/16 e 18 1/16 polegadas . A observação indica que cerca de 2,5% são rejeitadas como muito
compridas e cerca de 2,5% como muito curtas. Presumindo que os comprimentos são normalmente
distribuídos em torno da média de 18 pol, ache o desvio padrão da distribuição. Depois calcule a
proporção de rejeição se os limites de tolerância são estreitados para 17 61/64 pol e 18 3/64 pol.

14- A vida média de um motor elétrico de 250 watts é de 8 anos, com um desvio padrão de 2 anos. O
fabricante substitui, gratuitamente, todos os motores que falham durante a garantia. Considerando que a
durabilidade dos motores tem distribuição normal, qual deve ser a garantia (quantos anos?) para que a
fábrica não tenha que substituir mais que 2% dos motores que vende? Que proporção dos motores ainda
estará em funcionamento após 11 anos de uso?

15-Cilindros de 1 cm de diâmetro devem encaixar em furos cujos diâmetros são normalmente distribuídos
com média de 1,002cm e desvio padrão de 0,00173 cm. A cada 2000 furos, quantos serão demasiado
pequenos?
COELM – Estatística – Marcio Bennemann20
16-Sabe-se que a vida média de certos componentes de máquinas são normalmente distribuídos com
média de 5000h e desvio padrão de 50h.
Qual é a probabilidade de:
a)um componente durar mais de 5030h?

b)um componente durar menos de 4900h?

c)um componente durar entre 4950h e 5050h?

17- A tabela abaixo da a resistência elétrica de 138 hastes de carbono, testadas à mesma temperatura.

Resistência em ohms 310 311 312 313 314 315 316 317 318 319 320
Nº de hastes 1 2 6 21 25 32 24 18 5 3 1

Os dados podem ser vistos como uma amostra razoável da distribuição normal?

Obs.: Podemos identificar a semelhança com a curva da distribuição normal.

Nº de Hastes Segundo a Resistência Elétrica -Ohms


35

30

25

20

15

10

0
308 310 312 314 316 318 320 322

Qual é a sua conclusão?

Considerando a distribuição normal, qual é a probabilidade de selecionarmos uma haste com


resistência superior a 317 ohms?

Qual é a probabilidade de selecionarmos uma haste com durabilidade entre 312 e 314 ohms?

COELM – Estatística – Marcio Bennemann21


Ministério da Educação
Universidade Tecnológica Federal do Paraná
Coordenação Química PR
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

Trabalho – 02 entregar em ....../....../............


Aluno(a):...........................................................................

1- Se 1,5% da produção da indústria I apresenta defeitos, em uma amostra com 12 componentes,


qual é a probabilidade de encontrarmos:
a)Um defeituoso? b)Menos de dois defeituosos?

2- 2% da produção da Indústria Z não satisfaz as exigências dos consumidores, então em uma


amostra com 8 produtos, qual é a probabilidade de:
a)Todos satisfazerem os clientes? b)Pelo menos um não satisfazer os clientes?

3- A duração, em horas, de componentes elétricos é normalmente distribuída com média 1400 e


desvio padrão 300.
a)Qual é a probabilidade de que um componente tomado ao acaso tenha vida entre 1400 e 1850h?

b)Qual é a porcentagem de componentes que durarão mais de 2100h?

c)Se os componentes são garantidos por 1000h, que porcentagem deles deve ser devolvida?

d)Que durabilidade o fabricante pode garantir se quiser que 95% dos componentes satisfaçam a
garantia?

4- Uma máquina produz arruelas cujos diâmetros tem média de 8mm com desvio padrão de 0,5mm.
Se a tolerância permitida no diâmetro é de 0,8mm, e pode-se presumir que o diâmetro tenha
distribuição normal, aproximadamente que porcentagem de arruelas será rejeitada?

5- Calcule a média e o desvio padrão:


a) Amostragem da temperatura ºC de funcionamento dos motores da linha de produção 01:
45 49 51 47 55 41 42 47 41 41 40

b) Amostragem dos tempos de execução da atividade xx na linha de produção 01: (segundos)


95 93 90 85 88 88
85 90 87 92 99 110

COELM – Estatística – Marcio Bennemann22


ESTIMATIVAS

Quando fazemos um estudo baseado em uma amostra, temos em mente projetar estes resultados
para toda a população, pois o objetivo do estudo é a identificação de características populacionais.
Estimamos as característica populacionais à partir de resultados amostrais, construindo intervalos com os possíveis
valores que a população pode assumir. Um intervalo é necessário porque se efetuamos diversas amostras, os resultados
provavelmente não serão os mesmos, mas deverão estar próximos, o que nos leva a admitir uma pequena variação em torno
dos resultados amostrais.

INTERVALO DE CONFIANÇA PARA MÉDIA


Estimamos a média populacional através do intervalo de confiança da média, onde vamos definir as possíveis
variações em torno da média amostral.
O que podemos considerar importante para a construção do intervalo?
Tamanho da amostra (quanto maior a amostra, maior confiabilidade ela inspirará)
Dispersão dos dados (se os dados são muito variados, dispersos, teremos um intervalo mais amplo para absorver estas
variações).
Nível de confiança (representa a probabilidade de acerto, por exemplo, 95% significa que se efetuarmos muitas
amostragens, em pelo menos 95% das amostras os resultados serão os mesmos). O nível de confiança será representado por t e
será encontrado na tabela da distribuição t de Student.
µ = média populacional

µ = x ± t.s x x = média amostral

t = valor da distribuição t representando o


nível de confiança
sx = erro amostral da média
n = tamanho da amostra

s
sx =
n
Exemplo: Fizemos uma amostragem sobre o consumo de óleo lubrificante nos motores MM em 24 horas de funcionamento.
Consumo em ml/motor
32 25 27 30 26 20 19 25 20 20
26 22 29 30 32 28 20 15 15 22

Inicialmente vamos calcular o consumo médio dos motores: média = .......................... e o


desvio padrão = .....................

Vamos determinar o erro amostral da média: s x = ...........................


Na tabela da distribuição t vamos identificar o valor t : (para isso precisamos determinar o nível de confiança, por exemplo
95% além do gl = n-1 )
Obs.: nosso intervalo poderá apresentar erro tanto abaixo como acima, então os 5% serão divididos em 2,5% para cada lado e
faremos a leitura na coluna 0,025.

Encontramos t = 2,093.

Finalmente construímos o intervalo com:

µ = 24,15 ± 2,093 . 1,168163

µ = 21,7 a 26,6

Estimamos que o consumo médio de óleo lubrificante fica entre 21,7 ml e 26,6 ml em 24 horas de funcionamento.

COELM – Estatística – Marcio Bennemann23


COELM – Estatística – Marcio Bennemann24
Exercício nº 18
Determine com 95% de confiança o intervalo que representa a média populacional referente as amostras abaixo:

a)Tempo de execução da atividade RR (em minutos). (tempo/unidade/funcionário)


3 3.6 3.8 3.9 4.1
2.9 3.5 4.2 3.2 3.8
3.5 3.3 4.2 4.0 3.0

b)Percurso (m) de frenagem do veículo Gol – 1000 com pneus Pirelli 165/70/13 a uma velocidade de 100Km/h.
38 40 39 41 42 44 40
48 38 39 39 44 41 35

c)Durabilidade (1000 Km) dos amortecedores Coffap ref. 2.x.45.vc.87.


78 84 66 84 90 84 85 69 71
70 66 60 85 80 74 66 63 59

O Intervalo de Confiança da Média é também utilizado para conferir se o


conteúdo (quantidade) encontrada nas embalagens está ou não de acordo com as indicações do rótulo.

Nestes intervalos consideramos que as variações toleráveis estão em torno do valor especificado no rótulo.

Exemplo:
Verificamos o volume contido em 25 recipientes (um litro) do óleo Lubrax S.
ml/embalagem 999 998 999 1000 1001 1002 1000 999
1002 999 1000 998 998 999 998 999 1000
1000 1001 999 998 999 996 998 999

Vamos testar com 99% de confiança se a quantidade encontrada satisfaz ou não as indicações do rótulo.

A média da amostra é 999,24 ml.; O desvio padrão 1,362596; e o erro amostral 0,272519;

µ = 1000 ± 2,797 . 0,272519 µ = 999,2378 ml a 1000,762 ml.

A média encontrada na amostra (999,24 ml) está contida no intervalo, portanto a empresa está embalando a
quantidade prevista.

COELM – Estatística – Marcio Bennemann25


Exercício nº 19
Verifique com 99% de confiança se as empresas estão ou não embalando (entregando) as quantidades indicadas no
rótulo de seus produtos:

a)Fio Pirelli nº 06, rolo com 100m.


99.6 99.8 100 100.1 99.5 99.9 100.1 100 100 100 99.6
99.8 99.8 99.8 99.9 99.8 99.8 99.9 100 100 100.1 100

b)Parafuso ref. 234.ut.4r , caixa com 200 unidades.


200 199 199 200 198 198 198 199 199 201
200 200 201 200 201 198 198 198 199 199
198 200 200 199 201 199 198 199 197 198

c)Bomba de combustível do Posto PP, recipiente de teste para aferição de 20 litros.


20.010 19.990 19.990 19.990 20.010 19.990 19.990 20.020
20.000 20.010 19.990 19.980 19.980 19.980 19.990 19.970

d)Solvente SS frasco com 5 litros: (amostras em ml)


5000 5001 4990 4998 5002 5000 5001
4998 4991 4990 4990 4980 4980 4987

e)Fluido de freio (500 ml)


499 499 498 498 497 499 500 500 499 500 501 499 499
501 500 500 501 501 501 500 500 499 499 501 499 500

f)Pasta para polimentos (250g)


248 248 247 248 248 249 249 250 250 248 249 250 250 249
249 250 251 250 250 249 248 248 250 249 247 248 248 249

COELM – Estatística – Marcio Bennemann26


INTERVALO DE CONFIANÇA PARA PROPORÇÃO

Quando obtemos uma proporção (porcentagem) na amostra devemos determinar as possíveis variações em torno desta
amostra para estimar os resultados populacionais.
Consideraremos:
Proporção obtida na amostra (p)
Nível de confiança (z) – encontrado na distribuição z de probabilidades

p.(1 − p )
Erro amostral da proporção (sp) sp =
n
Tamanho da amostra (n)

P = p ± z.s p
Exemplo:
Uma amostragem com 380 peças produzidas na Indústria I revelou 7 peças defeituosas. Determine com 95% de
confiança a proporção de peças defeituosas.
7
p= = 0,0184 sp = 0.006898 z = 1,96
380

P = 0.0184 ± 1,96 . 0.006898

P = 0,00488 a 0.03192

Estimamos que a produção apresenta de 0,488% a 3,192% de peças defeituosas

Exercício nº 20
Determine o intervalo da proporção com 90% de confiança para as seguintes amostras:
a)Observamos 32 falhas em 700 execuções da atividade S.

b)Encontramos 41 produtos defeituosos em uma amostragem com 800 unidades.

Exercício 21
Uma concessionária verificou que nos últimos 280 test drive 31 carros foram vendidos. Determine com 95% de
confiança o intervalo que representa a proporção dos test drive que resultam em venda do veículo.

COELM – Estatística – Marcio Bennemann27


Ministério da Educação
Universidade Tecnológica Federal do Paraná
Coordenação Química PR
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

Trabalho – 03 entregar em ..../....../........


Aluno(a):...........................................................................................

1- Determine o intervalo de confiança para a média com 95% de confiança:


a)
400 412 416 405 398 402 410 408 400

b)
33 36 35 33 32 32
31 30 30 32 35 30

2- Verifique com 99% de confiança se a média amostral satisfaz o valor indicado no rótulo:
a)Rótulo = 500

498 499 500 500 500 500 501 501 500 502
499 499 499 495 495 498 499 499 499 500

b)Rótulo = 100
99 99 98 98 99 99 100 100 100 101 101 101 100 99 99
98 98 97 97 97 99 97 97 97 97 98 99 99 99 100

03-Determine o intervalo de confiança que representa com 90% de confiança a proporção em cada
caso:
a)Amostra com 540 elementos onde 30 apresentaram defeito;

b)Amostra com 300 elementos onde 12 não satisfazem as exigências do cliente.

COELM – Estatística – Marcio Bennemann28


TAMANHO DA AMOSTRA
Para realizarmos um estudo amostral, devemos selecionar uma amostra representativa da população, ou seja,
precisamos de uma amostra que absorva todas as características populacionais.
Quanto maior for o conhecimento a respeito da população, melhores serão as chances de escolhermos uma boa
amostra.
O cálculo do nº de componentes da amostra se fundamenta no tamanho da população (quanto maior a população,
maior será a amostra, embora que esta relação não seja diretamente proporcional), dispersão dos dados (quanto mais
dispersos forem os dados, maior será a amostra), confiabilidade dos resultados (quanto maior a confiabilidade, maior será a
amostra), erro tolerável (quanto maior a margem de erro tolerável, menor será a amostra).

AMOSTRAS PARA CÁLCULO DE MÉDIAS

Quando o objetivo da amostra é calcular médias, a amostra será definida da seguinte forma:

z 2 .s 2 n 0 .N
no = n=
E ²0 n0 + N

n0 representa a estimativa do tamanho da amostra (prevê uma amostra sem considerar o


tamanho da população)
z representa o nível de confiança (é obtido na tabela da distribuição normal)
p/ 90% de confiança, z = 1,645; p/ 95% de confiança z = 1,96

s é o desvio padrão (quando não conhecemos o desvio padrão podemos fazer uma amostra
piloto, onde com algumas amostras estimamos o desvio padrão).

E0 é o erro amostral tolerável (depende do nível de precisão necessário).

N representa o total de elementos da população

Exemplo:
Devemos identificar o diâmetro médio de um lote com 2000 peças. Para isso faremos uma
amostragem com nível de confiança de 95%, tolerando um erro amostral de 0,01mm, sabendo que o
desvio padrão (identificado em outros levantamentos) é de 0,03mm. Quantas peças deverão compor a
amostra?

z = 1,96 n0 = 1,96².0,03³ / 0,01² n = 34,57 . 2000 / (34,57 + 2000 )


s = 0,03
E0 = 0,01 n0 = 34,57 n = 33,98
N = 2000
n = 34 peças
A amostra deverá conter 34 peças escolhidas preferencialmente de modo aleatório.

Exercício 22
Calcule o número de peças necessárias para uma amostragem em um lote com 3500 unidades
onde queremos identificar o peso médio das peças, sabendo que o desvio padrão é de 180g e que
desejamos um nível de confiança de 90%, tolerando um erro amostral de 30g.

COELM – Estatística – Marcio Bennemann29


Exercício 23
Um analista deseja calcular o tempo médio de duração de cada ciclo para uma operação de
montagem, tolerando variações de ± 0,03 min a um nível de confiança de 95%. Se o desvio padrão do
tempo de cada ciclo é de 0,18 min, quantas observações (cronometragens) serão necessária?
Obs.: como não dispomos do total de ciclos realizados, não temos a população, ficando osso
cálculo limitado a n 0 .

Exercício 24
Determine o tamanho da amostra necessária para rever a média populacional com 95% de
confiança para uma máquina que produz mil unidades por dia, sabendo que o desvio padrão é de 5,8g
tolerando um erro amostral de 1,2g.

Exercício 25
Para identificar o consumo médio de fluído de bateria, nas Baterias Exced – 100 A, devemos fazer
um levantamento amostral, tolerando um erro amostral de até 15 ml para um desvio padrão estimado com
uma amostra piloto ( 152; 160; 200; 160; 100; 110). Quantas baterias devem compor a amostra ara uqe
tenhamos um nível de confiança de 90%?

Exercício 26
Selecione na tabela abaixo a amostra definida no exercício anterior (descreva o procedimento de
escolha dos elementos) e em seguida determine o intervalo e confiança que representa o consumo médio e
fluído por bateria. (ml de fluído por bateria).
207 162 191 162 208 171 172 158 189 170
198 210 158 202 179 203 156 167 209 170
198 210 181 176 199 182 156 177 185 177
203 178 171 168 158 186 199 199 182 198
200 156 195 158 175 193 152 150 202 183
173 164 174 160 183 192 173 188 187 191
207 179 186 177 166 152 207 178 174 175
165 183 155 204 209 202 175 209 193 158
155 187 193 179 181 153 166 182 197 186

COELM – Estatística – Marcio Bennemann30


AMOSTRA PARA O CÁLCULO DE PROPORÇÕES

z 2 . p.(1 − p ) n 0 .N
n0 = n=
E0
2
n0 + N

O valor p representa uma proporção identificada em pesquisa similar anteriormente. Caso


estejamos fazendo uma pesquisa inédita utilizamos p = 0,5 (50%) já que este é o valor que
determina a maior amostra.

Exemplo:
Para identificar o percentual de itens defeituosos em cada lote de 5000 peças, faremos
amostragens com 95% de confiança, tolerando um erro amostral de no máximo 1,5%. Quantas peças
deverão compor a amostra se historicamente a indústria apresenta 3,1% de defeitos?
N = 5000
z = 1,96
E0 = 0,015
p = 0,031
1,96 2 .0,031.(1 − 0,031)
n0 = n 0 = 512,87
0,015 2

5000.512,87
n= n 0 = 465 peças
5000 + 512,87

Exercício 27
Um gerente de processamento de dados calcula que um operador de computador está
ocioso 20% do tempo. Para ser mais preciso resolveu fazer uma amostragem (realizar algumas
observações durante o expediente para verificar se o funcionário está realmente ocioso). Quantas
observações devem ser feitas para que se tenha um nível de confiança de 90%, tolerando uma
variação de até 5%?

Exercício 28
Uma empresa com cerca de 2500 clientes deseja fazer um levantamento amostral para identificar a
proporção de seus clientes que está satisfeita com o atendimento. Quantos clientes devem ser
entrevistados para que tenhamos 95% de confiança, tolerando um erro amostral de até 5%?

Exercício 29
Uma certa operação de montagem na Indústria T muitas vezes acaba sendo repetida por alguma
falha operacional. A gerência deseja saber qual é o percentual de repetições que apresentam falhas,
observando um nível e confiança de 90%, tolerando erro amostral de 5%. Quantas operações de
montagem devem ser observadas?
COELM – Estatística – Marcio Bennemann31
Ministério da Educação
Universidade Tecnológica Federal do Paraná
Coordenação Química PR
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

Trabalho 04 entregar em ...../......./........


Aluno(a):..........................................................................................
01-Devemos fazer uma amostragem entre as 3000 residências do Município PPP para identificar a
proporção destas que apresentam falhas nas instalações elétricas. Quantas residências devem ser
inspecionadas para que tenhamos 90% de confiança, tolerando um erro de 2,4%?

02- Para identificar o número médio de aparelhos eletroeletrônicos nas residências do município PPP
(4000 residências), faremos uma amostragem com 95% de confiança, tolerando um erro amostral de 1,5 e
um desvio padrão de 3,4 (aparelhos por residência). Quantas residências devem participar da amostra?

03-Uma operação que demora em média 2,5 min com desvio padrão de 0,8 min é repetida cerca de 6000
vezes por ano. Para definirmos uma amostra com 95% de confiança, quantas cronometragens devem ser
feitas?

04-Uma amostra piloto quanto a espessura das chapas CCCC revelou os seguintes valores: (mm) 12,2;
12,1 ; 11,9; 12; 11,7 ; 12,7. Sendo a produção total de 30000 chapas por mês, quantas amostras devem ser
coletadas para que tenhamos 95% de confiança na determinação do diâmetro médio para um erro de no
máximo 0,1mm?

COELM – Estatística – Marcio Bennemann32


GRÁFICOS DE CONTROLE

Para o controle das variáveis, partimos da hipótese de que a variável a ser controlada segue a
distribuição normal. Portanto deve-se controlar média e o desvio padrão da distribuição, que se não
tiverem variação ao longo do tempo caracterizam o chamado processo sob controle. Portanto um processo
sob controle é aquele em que as variáveis não apresentam variação de média ou de desvio padrão ao
longo do tempo.

Tabela de Coeficientes
n A D4 D3
2 1,880 3,268 0
3 1,023 2,574 0
4 0,829 2,282 0
5 0,577 2,115 0
6 0,483 2,004 0
7 0,419 1,924 0,076
8 0,373 1,864 0,136
9 0,337 1,816 0,184
10 0,308 1,777 0,223
12 0,266 1,716 0,284
14 0,235 1,671 0,329
16 0,212 1,636 0,364
18 0,194 1,608 0,392
20 0,180 1,586 0,414

Para estabelecer os Limites de Controle, devemos estabecer:

O nº de elementos de cada amostra (n)



A média das médias dos lotes ( x )
A amplitude de cada amostra (R)
[a amplitude é a diferença entre a maior e a menor medida coletada na amostra]
_
A média das amplitudes dos lotes ( R )
Definir os coeficientes: A; D4; D3.

LIMITES DO GRÁFICO DE CONTROLE DA MÉDIA


_ _
LSC = x + A. R (Limite superior de controle)
_
LM = x (Limite médio)
_ _
LIC = x − A. R (Limite inferior de controle)

LIMITES DO GRÁFICO DE CONTROLE DA AMPLITUDE

_
LSC = D4 . R (Limite superior de controle da amplitude)
_
LM = R (Limite médio da amplitude)
_
LIC = D3 . R (Limite inferior de controle da amplitude)

COELM – Estatística – Marcio Bennemann33


Exemplo:
Uma empresa de produtos alimentícios ensaca arroz em sacos com capacidade nominal de 5Kg,
que é o mínimo que o consumidor espera quando adquire o produto. A empresa regulou seu processo de
ensaque e agora deseja instituir gráficos de controle para o peso do produto.
Pondo em funcionamento seu processo de ensaque, a empresa recolheu (dos sacos produzidos),
durante três dias seguidos, 9 lotes, cada um com 5 sacos (5 amostras), obtendo os resultados abaixo:
Lote Amostra1 Amostra2 Amostra3 Amostra4 Amostra5 Média Amplitude
1 5,012 5,000 5,001 5,003 4,999
2 5,002 4,998 5,004 5,008 5,014
3 5,008 5,012 5,011 5,019 5,000
4 5,014 5,016 5,020 5,010 5,000
5 5,009 5,016 4,995 5,000 5,012
6 5,006 5,020 5,014 5,014 5,000
7 5,015 5,013 5,000 5,014 5,008
8 5,000 5,016 5,000 4,996 5,002
9 5,000 5,000 5,002 5,006 5,008
_ _
x= R=

Gráfico de Controle da Média - Pacotes de Arroz

5,02
5,015
5,01
5,005
5
4,995
4,99
4,985
1º 2º 3º 4º 5º 6º 7º 8º 9º
Lote

Média LSC Lm LIC

Gráfico de Controle da Amplitude - Pacotes de Arroz

0,04
0,035
0,03
0,025
0,02
0,015
0,01
0,005
0
1º 2º 3º 4º 5º 6º 7º 8º 9º
Lote

Amplitude LSC LM LIC

COELM – Estatística – Marcio Bennemann34


Exercício:
Construa os gráficos de controle:
GRÁFICO DE CONTROLE DA MÉDIA e DA AMPLITUDE

Informe as medidas coletadas nas amostras


Nº da
Amostra 1ª medida 2ª medida 3ª medida 4ª medida 5ª medida Média Ampl. LSCx LMx LICx
1ª 500 502 500 501 504
2ª 497 497 499 497 500
3ª 499 501 498 502 500
4ª 503 502 501 500 504
5ª 502 500 500 499 498
MÉDIA

Exercício:
Calcule os Limites de controle e construa os gráficos de controle da média e da amplitude

Amostra Elemento1 el.2 el.3 el.4


1ª 1200 1212 1214 1220
2ª 1200 1996 1995 1210
3ª 1210 1990 1200 1215
4ª 1230 1194 1198 1200
5ª 1190 1200 1210 1215
6ª 1195 1216 1250 1210

COELM – Estatística – Marcio Bennemann35


Ministério da Educação
Universidade Tecnológica Federal do Paraná
Coordenação Química PR
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

Trabalho 05 entregar em ...../......./........


Aluno(a):..........................................................................................................................................................
Imprimir e colar nesta folha.
Gráfico de controle da média e gráfico de controle da amplitude.
a) Volume (ml) por recipiente:

Lote am1 am2 am3 am4 am5 am6 am7


1º 985 1002 1002 1000 1003 995 1002
2º 1000 1000 1002 1003 996 999 998
3º 995 1001 1000 1005 1000 1000 998
4º 990 1000 1002 1002 1003 1000 1000
5º 1002 999 995 998 1002 1001 1010
6º 1000 1002 1006 1001 1000 1004 1009

b) Componente RT no medicamento TT, mg por comprimido.

Lote am1 am2 am3 am4 am5 am6


1º 14 15 18 14 10 8
2º 15 16 15 14 12 12
3º 11 12 14 13 15 12
4º 9 10 12 12 14 8
5º 8 12 13 15 14 8
6º 10 12 11 11 12 13
7º 12 12 10 10 10 11
8º 12 15 14 11 12 9

COELM – Estatística – Marcio Bennemann36


CORRELAÇÃO E REGRESSÃO LINEAR

A Correlação é o processo de verificação da existência ou não de correspondência entre duas


variáveis. A correlação linear procura identificar se as variáveis se comportam linearmente, ou
seja, se elas se aproximam de uma reta quando relacionadas em um gráfico (diagrama de
dispersão)
Corre lação Line ar Ne gativa

6000
4000

V. D.
2000
0
0 10 20 30 40
V . I.

Corre lação Pos itiva

200
150
100
50
0
0 2 4 6 8

Corre lação Nula

1500
1000
V. D.

500
0
0 10 20 30
V.I.

O diagrama nos da uma boa visão do comportamento da variáveis, no entanto, precisamos definir qual é o grau de
aproximação a uma reta. Isto pode ser feito através do coeficiente de correlação linear.
O Coeficiente de Correlação Linear (r) é um valor compreendido entre 1 e –1 com o seguinte significado:
Quando r assume o valor –1 indica correlação linear perfeita negativa (os pontos se alinham de forma decrescente)
Quando r assume o valor 1 indica correlação linear perfeita positiva (os pontos se alinham de forma crescente)
Quando r está próximo de zero indica que não há correlação.
Quando r está próximo a 1 ou a –1 ( − 1 ≤ r ≤ − 0,8 ) ou ( 0,8 ≤ r ≤ 1 ), temos uma correlação forte.

Cálculo de r

COELM – Estatística – Marcio Bennemann37


∑ x.∑ y
∑ xy −
n
r=

 ∑ x2 −
( ∑ x) 2

 . ∑ y 2 −
(∑ y) 2


 n   n 

x representa a variável independente


y representa a variável dependente
n representa o número de pares (x;y)

Exemplo:
Relação entre percurso de frenagem e velocidade
Velocidade (Km/h) Percurso de Frenagem (m) x² y² xy
40 12 1600 144 480
50 20 2500 400 1000
60 26 3600 676 1560
80 37 6400 1369 2960
100 56 10000 3136 5600
120 71 14400 5041 8520
450 222 38500 10766 20120

450.222
20120 −
r= 6
r=0,9966 (correlação forte positiva)
 450 2   222 2 
 38500 − .
 10766 − 
 6  6 

Exercícios:
Calcule o coeficiente de correlação linear e classifique a correlação:
a) Valor de mercado do UNO segundo o tempo de uso.
Tempo de uso (anos) Valor Médio de Mercado
0 14500
1 12000
2 10500
3 8500
4 7800
5 7200
6 6500
7 5800

COELM – Estatística – Marcio Bennemann38


b) Custo de manutenção do Gol por ano (10000
Km/ano)

Quilometragem (1000) Custo Anual (R$)


1 100
2 150
3 200
4 280
5 350
6 450
7 480
8 500
9 530
10 550

c)
Nível de ruído dos motores elétricos EE segundo o tempo de uso (h)

c)Horas de Uso Nível de Ruído (Decibeis)


100 25
200 31
300 32,5
400 33
500 33,9
600 34,3
800 35,1
1000 35,7
1500 37
2000 38

d)Análise do Faturamento da Indústria II Segundo o Nº de Func.


Nº de Funcinários x Faturamento (R$ 1000,00)
5 25
8 29
15 38
25 56
40 79
65 100
69 114

e)Velocidade Km/h Consumo Km/l


60 16
70 15,5
80 15
90 14
100 13
110 12,2
120 11,7

COELM – Estatística – Marcio Bennemann39


A Regressão Linear corresponde a definição da Equação Linear que melhor se ajusta as variáveis.

A equação linear segue o modelo: y = a + bx


“a” representa o coeficiente linear
“b” representa o coeficiente angular

Cálculo dos coeficientes:

∑ x.∑ y
∑ xy −
n
b=
(∑ x) 2
∑ x2 −
n
_ _
a = y − b. x
Exemplo:

Relação entre percurso de frenagem e velocidade


Velocidade (Km/h) Percurso de Frenagem (m) x² y² xy
40 12 1600 144 480
50 20 2500 400 1000
60 26 3600 676 1560
80 37 6400 1369 2960
100 56 10000 3136 5600
120 71 14400 5041 8520
450 222 38500 10766 20120
450.222
20120 −
b= 6
b= 0,7305
450 2
38500 −
6

222 450
a= − 0,7305. a=-17,787
6 6

A função de regressão linear será: y = − 17,787 + 0,7305 x


Com esta função podemos fazer estimativas:
Qual será o percurso de frenagem para velocidade de 95 Km/h?

y = − 17,787 + 0,7305.95 y=51,6 m

Correlação e Regres s ão no Excel

80
y = 0,7305x - 17,789
60
R 2 = 0,9933
40
20
0
0 50 100 150

COELM – Estatística – Marcio Bennemann40


Exercícios:
Calcule o coeficiente de correlação linear, determine a função de regressão linear e faça as estimativas:
a)Equipamento Elétrico
Tensão (V) ºC com 2h de funcionamento
110 45
111 43
113 41
115 38
117 35
118 38
120 43

Qual será a temperatura para uma tensão de 119V

b)Consumo de energia segundo o nº de componentes da família


Nº Componentes Consumo (KWH)
1 70
2 80
3 95
4 115
5 140
6 180
Estime o nº de componentes para um consumo de 300KWH

c)Produção de lixo
Nº de pessoas Kg de lixo/dia
1 1,5
2 2,2
3 2,9
4 3,7
5 4,5
6 5,1

Estime a produção de lixo por uma família com 10 pessoas.

COELM – Estatística – Marcio Bennemann41


Ministério da Educação
Universidade Tecnológica Federal do Paraná
Coordenação Química PR
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

Trabalho 06 entregar em ...../......./........


Aluno(a):..........................................................................................................................................................
1-Construa o diagrama de dispersão(micro), calcule o coeficiente de correlação linear (r)(fórmula) e faça
a regressão linear (y = a + bx)(fórmula).

Temperatura (ºC) Erro no cálculo do volume (cm³)


15 2
18 3,3
21 5
25 6,8
31 9
40 13

2-Construa o diagrama de dispersão(micro), calcule o coeficiente de correlação linear (r)(micro) e faça a


regressão linear (y = a + bx)(micro).Imprima os resultados e cole.

Preço (R$) Demanda (1000 unidades)


7,7 140
8,12 130
9,16 110
10,25 95
11,4 85
13,5 70
15,6 50

03-Construa o diagrama de dispersão, calcule o coeficiente de correlação linear, determine a função de regressão linear e faça
as estimativas:
Pneus PPP
Velocidade Km/h Durabilidade (1000 Km)
60 70
80 55
100 40
110 30

a)Estime a durabilidade a uma velocidade de 92Km/h

b)Estime a velocidade para durabilidade de 60000Km.

COELM – Estatística – Marcio Bennemann42


Inferência Estatística – Teste de Hipóteses

Uma pergunta que aparece freqüentemente em Ciência é a seguinte: o método A é melhor que o
método B? Em termos estatísticos, ela eqüivale a comparar dois conjuntos de informações, resultantes de
medidas obtidas da aplicação dos dois métodos a dois conjuntos de objetos ou indivíduos.
Uma dificuldade que enfrentamos é a de caracterizar adequadamente a igualdade ou equivalência
de duas populações. Por exemplo, suponha que queremos saber se duas máquinas produzem peças com a
mesma homogeneidade quanto a resistência a tensão.

Inferência para duas médias provenientes de amostras independentes.

Aqui temos dados na forma de duas amostras, extraídas independentemente de cada população. É
muito comum um experimento do tipo “controle” versus “tratamento”, nos quais o interesse principal é
verificar o efeito desse último.

Hipóteses do teste: H0 : x1 = x2 (as amostras apresentaram médias iguais, ou


seja, as diferenças observadas são casuais)

H1 : x1 > x2 (os dados evidenciam que a média da amostra


1 é maior que a média da amostra 2)

A fim de verificar estas hipóteses, podemos aplicar o teste t para amostras independentes,
admitindo que os dados provêm de populações com distribuição normal e mesma variância.

Estatística do Teste t

x1 = média da amostra 1
n1 = nº de elementos da amostra 1
s1 = desvio padrão da amostra 1

x2 = média da amostra 2
n2 = nº de elementos da amostra 2
s2 = desvio padrão da amostra 2

gl = n1 + n2 – 2 (graus de liberdade)

∝ = nível de significância do teste (percentual que limita a possibilidade de erro em rejeitar a hipótese
nula)

sa = desvio padrão agregado teste

x1 − x 2
(n1 − 1) s12 + (n 2 − 1) s 22 t=
Sa = 1 1
gl Sa +
n1 n2

COELM – Estatística – Marcio Bennemann43


Ex.: Duas técnicas de venda são aplicadas por dois grupos de vendedores: a técnica A, por 12 vendedores,
e a técnica B, por 15 vendedores. Esperava-se que a técnica B produza resultados melhores. No final de
um mês, verificamos os seguintes resultados:

Dados Vendas
Técnica A Técnica B
Média 68 76
Desvio Padrão 7,071 8,66
Nº vendedores 12 15

Vamos testar com nível de significância de 5%, se há diferenças significativas entre as vendas
resultantes das duas técnicas.
As hipóteses a serem testadas: H0 : µa = µb
H1 : µa < µb

Exercícios:
1- Num estudo comparativo do tempo médio de adaptação, uma amostra aleatória, de 50 homens e 50
mulheres de um grande complexo industrial, produziu os seguintes resultados:
Estatísticas Homens Mulheres
Média 3,2 anos 3,7 anos
Desvpad 0,8 anos 0,9 anos
Que conclusões você poderia tirar para a população de homens e mulheres dessa indústria, a um nível de
significância de 5%?

2- Uma fábrica de embalagens para produtos químicos está estudando dois processos para combater a
corrosão de suas latas especiais. Para verificar o efeito dos tratamentos, foram usadas amostras cujos
resultados estão no quadro abaixo:
Método Amostra Média Desvpad
A 15 48 10
B 12 52 15
Qual seria a conclusão sobre os dois tratamentos a um nível de significância de 5%.

COELM – Estatística – Marcio Bennemann44


3- O milho comum não contém tanto aminoácido lisina quanto os animais necessitam em sua
alimentação. Os cientistas botânicos desenvolveram variedades de milho que têm teores maiores de
lisina. Em um teste de qualidade do milho com alto teor de lisina destinado ao alimento de animais,
um grupo experimental de 20 pintos machos de um dia de vida ingeriu uma ração contendo o a nova
variedade de milho. Um grupo de controle de outros 20 pintos machos ingeriu ração idêntica,
contendo porém o milho normal. Eis os ganhos de peso (em gramas) após 21 dias :
Controle Experimental
380 321 366 356 361 447 401 375
283 349 402 462 434 403 393 426
356 410 329 399 406 318 467 407
350 384 316 372 427 420 477 392
345 455 360 431 430 339 410 326
Há evidências convincente de que os pintos que ingerem milho com alto teor de lisina aumentam
de peso mais rapidamente, considerando um nível de significância de 5%?

4- Verifique se há diferenças entre as médias dos comprimentos das chapas Y cortadas pelos
funcionários do turno da manhã e do turno da tarde. (nível de significância de 5%)Amostragem
02/02(mm)
Manhã Tarde
500,06 500,01 500 500 499,96 500,06
500,01 500,01 500 500 499,97 500,08
500,03 500,02 500,05 500 499,96 500,04
500 500 500,04 499,95 499,99 499,95
500 499,99 500,01 499,95 500 499,96
500,02 499,99 500,01 499,95 500,01 500,05
500,06 499,95 500,04 499,98 500,06 500,08

5- O efeito da corrente na soldagem sobre a resistência à ruptura foi estudado, tendo sido encontrados os
seguintes valores:
Corrente Resistência a ruptura em(Kgf ?)
35A 37 29 35 28 24 36 40 37 33 28 39
45A 22 32 27 30 24 34 32 20 24 25 28 26 26
Existe alguma diferença na resistência à ruptura das soldas produzidas com o uso destas duas correntes?
(nível de significância de 5%)

COELM – Estatística – Marcio Bennemann45


Ministério da Educação
Universidade Tecnológica Federal do Paraná
Coordenação Manutenção Industrial PR
UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

Trabalho 07
Aluno(a):.....................................................................................
01- Um teste utilizando uma amostra de 175 latas de alumínio de 0,0109 in. de espessura, e uma Segunda amostra de 175 latas
de alumínio de 0,0111 in. De espessura. Ambas as amostras foram submetidas a cargas axiais determinando as seguintes
estatísticas.
Cargas axiais (lb) das Cargas axiais (lb) das
Latas de 0,0109 in. Latas de 0,0111 in. In. = inch = polegadas
n1 = 175 n2 = 175
x1 = 267,1 x2 = 281,8
s1 = 22,1 s2 = 27,8
No nível de significância de 5%, teste a afirmação de que a amostra dois apresenta resistência média maior. (teste t para
amostras independentes)
02-Aplique o teste t ao nível de significância de 5% para comparar as médias:
a)A=Grupo controle; B= Experimento

A 30 33 31 30 32 29 30 33 30

B 31 28 29 29 30 30 29 31 30

b)C=grupo C ; D=grupo D

C 400 411 410 400 400 415 416 417 400 411 410

D 399 401 402 400 405 405 405 410 410 415 40

03- Interprete os resultados do teste t expresso na tabela abaixo:

Administrou-se gentamicina a 6 pacientes e, posteriormente, a mesma quantidade da droga foi dada aos mesmos pacientes 30 minutos após injeção de
fenobarbital. Os resultados abaixo mostram a concentração sanguínea de gentamicina nas duas situações:

A concentração plasmática de gentamicina aumenta com a administração de fenobarbital ao nível de significância de 5%?

Teste-t: duas amostras presumindo variâncias equivalentes

Gentamicina Gentamicina após Fenobarbital


Média 4,033333333 4,15
Variância 1,010666667 1,907
Observações 6 6
Variância agrupada 1,458833333
Hipótese da diferença de média 0
gl 10
Stat t -0,167303327
P(T<=t) uni-caudal 0,435233119
t crítico uni-caudal 1,812461505

COELM – Estatística – Marcio Bennemann46


Teste do qui quadrado
Este teste objetiva verificar se a freqüência absoluta observada de uma variável é
significativamente diferente da distribuição de freqüência absoluta esperada.

Teste do qui quadrado para uma amostra


Aplica-se quando se quer estudar a dependência entre duas variáveis, através de uma tabela de
dupla entrada ou também conhecida como tabela de contingência.

Condições para a execução do teste


Exclusivamente para variáveis nominais e ordinais;
Observações independentes;
Não se aplica se 20% das observações forem inferiores a 5
Não pode haver freqüências inferiores a 1;
Nos dois últimos casos, se houver incidências desta ordem, aconselha-se agrupar os dados segundo um critério em
específico.

Procedimento para a execução do teste


1. Determinar H0. Será a negativa da existência de diferenças entre a distribuição de freqüência observada e a
esperada;
2.Estabelecer o nível de significância (∝ );
3. Determinar a região de rejeição de H0. Determinar o valor dos graus de liberdade (φ), sendo K – 1 (K = número
de categorias). Encontrar portanto, o valor do Qui-quadrado tabelado;
1. Calcular o Qui Quadrado, através da fórmula:

Sendo o Qui Quadrado calculado, maior do que o tabelado, rejeita-se H0 em prol de H1.

Exemplo:
Um vendedor trabalhou comercializando um produto em sete bairros residenciais de uma mesma cidade em um
mesmo período do ano.
Seu gerente decidiu verificar se o desempenho do vendedor oscilava em virtude do bairro trabalhado, ou seja, se as
diferenças eram significativas nos bairros trabalhados.
A partir deste estudo o gerente poderia então elaborar uma estratégia comercial para cada bairro ou manter uma para
todos.

Bairro 1 2 3 4 5 Total

Valores
9 11 25 20 15 80
Observados

Valores Esperados 16 16 16 16 16 80

COELM – Estatística – Marcio Bennemann47


H0: não há diferenças significativas entre os bairros

H1: as diferenças observadas para os bairros 3 e 4 são significativamente diferentes para melhor em relação aos
demais bairros.
∝ = 0,05
g.l = 5 – 1 = 4, onde Qui quadrado tabelado é igual a 9,49.

Χ2 = (9-16)2 + (11 – 16) 2 + (25-16) 2 + (20 – 16) 2 + (15 – 16) 2/16

Χ2 = 72 + 52 +92 + 42 + 12= 172/16 = 10,75


Conclui-se que o Qui quadrado calculado (10,75) é maior do que o tabelado (9,49), rejeita-se H0 em prol de H1.

Portanto há diferença significativa, ao nível de 0,05, para os bairros 3 e 4. Face ao cálculo o gerente deve elaborar
uma estratégia comercial para cada bairro.

No exemplo os valores esperados foram todos iguais porque esperava-se o mesmo desempenho do
vendedor em todos os bairros.

Calcularemos os VALORES ESPERADOS da seguinte forma:

Multiplicaremos o total da linha pelo total da coluna e em seguida dividimos pelo total geral.

01- aplique o teste qui-quadrado ao nível de significância de 5%.


a)
Ingestão de Bebida Alcoólica Segundo o Gênero – Amostragem -09
Ingestão semanal Masculino Feminino
Sim 250 120
Não 160 100

b)
Insetos TT e RR capturados segundo a cor da armadilha – Exp. UTFPR-09
Cor da armadilha Nº de insetos TT capturados Nº de insetos RR capt.
Amarela 350 210
Azul 300 200
Vermelha 450 230
Verde 520 240

COELM – Estatística – Marcio Bennemann48


Tabela para a distribuição chi-quadrado

A primeira coluna da tabela contém valores inteiros para o grau de liberdade ν da distribuição.
Os valores numéricos do cabeçalho (primeira linha) indicam as áreas à direita para os valores de x nas colunas
correspondentes.

ν / A 0,995 0,990 0,975 0,950 0,900 0,750 0,500 0,250 0,100 0,050 0,025 0,010 0,005
01 0,000 0,000 0,001 0,004 0,016 0,102 0,455 1,323 2,706 3,841 5,024 6,635 7,879
02 0,010 0,020 0,051 0,103 0,211 0,575 1,386 2,773 4,605 5,991 7,378 9,210 10,597
03 0,072 0,115 0,216 0,352 0,584 1,213 2,366 4,108 6,251 7,815 9,348 11,345 12,838
04 0,207 0,297 0,484 0,711 1,064 1,923 3,357 5,385 7,779 9,488 11,143 13,277 14,860
05 0,412 0,554 0,831 1,145 1,610 2,675 4,351 6,626 9,236 11,071 12,833 15,086 16,750
06 0,676 0,872 1,237 1,635 2,204 3,455 5,348 7,841 10,645 12,592 14,449 16,812 18,548
07 0,989 1,239 1,690 2,167 2,833 4,255 6,346 9,037 12,017 14,067 16,013 18,475 20,278
08 1,344 1,647 2,180 2,733 3,490 5,071 7,344 10,219 13,362 15,507 17,535 20,090 21,955
09 1,735 2,088 2,700 3,325 4,168 5,899 8,343 11,389 14,684 16,919 19,023 21,666 23,589
10 2,156 2,558 3,247 3,940 4,865 6,737 9,342 12,549 15,987 18,307 20,483 23,209 25,188
11 2,603 3,053 3,816 4,575 5,578 7,584 10,341 13,701 17,275 19,675 21,920 24,725 26,757
12 3,074 3,571 4,404 5,226 6,304 8,438 11,340 14,845 18,549 21,026 23,337 26,217 28,300
13 3,565 4,107 5,009 5,892 7,042 9,299 12,340 15,984 19,812 22,362 24,736 27,688 29,819
14 4,075 4,660 5,629 6,571 7,790 10,165 13,339 17,117 21,064 23,685 26,119 29,141 31,319
15 4,601 5,229 6,262 7,261 8,547 11,037 14,339 18,245 22,307 24,996 27,488 30,578 32,801
16 5,142 5,812 6,908 7,962 9,312 11,912 15,339 19,369 23,542 26,296 28,845 32,000 34,267
17 5,697 6,408 7,564 8,672 10,085 12,792 16,338 20,489 24,769 27,587 30,191 33,409 35,718
18 6,265 7,015 8,231 9,390 10,865 13,675 17,338 21,605 25,989 28,869 31,526 34,805 37,156
19 6,844 7,633 8,907 10,117 11,651 14,562 18,338 22,718 27,204 30,144 32,852 36,191 38,582
20 7,434 8,260 9,591 10,851 12,443 15,452 19,337 23,828 28,412 31,410 34,170 37,566 39,997
21 8,034 8,897 10,283 11,591 13,240 16,344 20,337 24,935 29,615 32,671 35,479 38,932 41,401
22 8,643 9,542 10,982 12,338 14,041 17,240 21,337 26,039 30,813 33,924 36,781 40,289 42,796
23 9,260 10,196 11,689 13,091 14,848 18,137 22,337 27,141 32,007 35,172 38,076 41,638 44,181
24 9,886 10,856 12,401 13,848 15,659 19,037 23,337 28,241 33,196 36,415 39,364 42,980 45,559
25 10,520 11,524 13,120 14,611 16,473 19,939 24,337 29,339 34,382 37,652 40,646 44,314 46,928
26 11,160 12,198 13,844 15,379 17,292 20,843 25,336 30,435 35,563 38,885 41,923 45,642 48,290
27 11,808 12,879 14,573 16,151 18,114 21,749 26,336 31,528 36,741 40,113 43,195 46,963 49,645
28 12,461 13,565 15,308 16,928 18,939 22,657 27,336 32,620 37,916 41,337 44,461 48,278 50,993
29 13,121 14,256 16,047 17,708 19,768 23,567 28,336 33,711 39,087 42,557 45,722 49,588 52,336
30 13,787 14,953 16,791 18,493 20,599 24,478 29,336 34,800 40,256 43,773 46,979 50,892 53,672

2
Exemplo 01: seja uma distribuição χ com 10 graus de liberdade. Na linha ν = 10 e coluna A = 0,100 encontra-se 15,987.

COELM – Estatística – Marcio Bennemann49


Portanto, P( x > 15,987 ) = 0,100.

COELM – Estatística – Marcio Bennemann50


ANÁLISE DE VARIÂNCIA – ANOVA

Trata-se de um teste de comparação entre médias, assim como o teste t, mas com capacidade de
comparação entre duas ou mais médias ao mesmo tempo. Trata-se de um teste mais robusto que o teste t.
Hipóteses:
Ho: Não se comprovou a diferença entre as médias;

H1: pelo menos um par de médias difere entre si.

Estatística do teste.

Determinar a média, o desvio padrão e a quantidade de elementos de cada grupo.


n1 = n º _ de _ elementos _ do _ grupo _ 1

n2 = n º _ de _ elementos _ do _ grupo _ 2

nn = nº _ de _ elementos _ do _ grupo _ n

_
x1 = média _ do _ grupoo _ 1

Determinar a média geral


_
_ _
_
n . x + n . x + ... + nn . x n
x= 1 1 2 2
n1 + n2 + ... + nn

Determinar a média quadrática entre os grupos:


n ⋅ ( x − x ) 2 + n2 ⋅ ( x2 − x ) 2 + n3 ⋅ ( x3 − x ) 2 + ... + nn ⋅ ( xn − x ) 2
MQE = 1 1
k−1
k = n.0 de grupos

Determinar a média quadrática dentro dos grupos:


(n1 − 1) ⋅ s12 + (n2 − 1) ⋅ s22 + (n3 − 1) ⋅ s32 + ... + (nn − 1) ⋅ sn2
MQD =
n1 + n2 + n3 + ... + nn − k

Calcular o valor F

MQE
F=
MQD

Alfa => Nível no qual deseja avaliar os valores críticos para a estatística F. O nível alfa é um nível de
significância relacionado à probabilidade de ocorrência de um erro tipo I (rejeição de hipótese
verdadeira).
Nível de significância => Padrão = 5%

Distribuição F (MQE/MQD, grau de liberdade do numerador, grau de liberdade do denominador)

Estatística do teste => Se a distribuição F(MQE/MQD, numerador, denominador) > 5% => Não houve
diferença significativa entre as médias ao nível de significância de 5%, na amostra.

COELM – Estatística – Marcio Bennemann51


COELM – Estatística – Marcio Bennemann52
Exemplo:
Aplicar o teste ANOVA ao nível de significância de 5% para comparar as médias dos três grupos.

Amostra A Amostra B Amostra C


50 48 46
50 49 55
51 49 52
56 52 51
52 55 50
49 56 48
48 53 47
50 51 46
50 54 43
50 48 50
49 48 55
49 55
50

Estatística do teste
Grupo Contagem Média Desvio P
Amostra A 12 50,33333 2,059715
Amostra B 11 51,18182 2,993933
Amostra C 13 49,84615 3,804518

ANOVA
Fonte da variação gl MQ F valor-P F crítico
Entre grupos 2 5,377331002 0,572434 0,569653 3,284924
Dentro dos grupos 33 9,393798121

Na tabela da distribuição F o gl do denominador será 30 (F=3,32) ou 35 (F=3,27). Na falta do gl


específico utilizar valor inferior.

Conforme os dados tabelados, o F calculado F= 0,57 é inferior ao F crítico F=3,32, portanto a


probabilidade p é maior que 5% (no computador = 56,96%).
Concluímos portanto que com estes dados não se comprovou a diferença entre as médias.

COELM – Estatística – Marcio Bennemann53


01-Análise de variância (ANOVA)
Os dados abaixo são pesos (g) de 10 estorninhos (pássaro stumus vulgaris)de cada uma dentre 4 situações diferentes de pousada. O interesse é
verificar se as médias diferem de um grupo para outro.

Grupo Pesos dos Estorninhos

1 78 88 87 88 83 82 81 80 80 89

2 78 78 83 81 78 81 81 82 76 76

3 79 73 79 75 77 78 80 78 83 84

4 77 69 75 70 74 83 80 75 76 75

A hipótese nula é de que as médias são iguais.

02- No livro Planejamento e Análise de Experimentos, 4.' edição (John Wiley & Sons, 1998), D. C. Montgomery descreve um experimento em que um
fabricante está interessado na resistência à tensão de uma fibra sintética. Suspeita-se que a resistência esteja relacionada à percentagem do algodão
na fibra. Cinco níveis de percentagem de algodão são usados e cinco replicatas são corridas em uma ordem aleatória, resultando nos dados a seguir.

% de
Algodão Observações

15 7 7 15 11 9

20 12 17 12 18 18

25 14 18 18 19 19

30 19 25 22 19 23

35 7 10 11 15 11

a) A percentagem de algodão afeta a resistência à ruptura do fio? Faça uma análise de variância. Use = 0,05.

03- No artigo "Planejamento Ortogonal para Otimização de Processo e Sua Aplicação a Ataque por Plasma" (Orthogonal Designfor Process
Optimization and Its Application to Plasma Etching), no periódico Solid State Technology, maio de 1987, G. Z. Yin e D. W. Jillie descrevem um
experimento para determinar o efeito da taxa de escoamento de C2F 6 sobre a uniformidade do ataque químico em uma pastilha de silicone usada na
fabricação de um circuito integrado. Três taxas de escoamento são usadas no experimento e a uniformidade (%) resultante, para seis replicatas, é
mostrada a seguir.

Escoamento
de C2F6 Observações

125 2.7 4.6 2.6 3.0 3.2 3.8

160 4.9 4.6 5.0 4.2 3.6 4.2

200 4.6 3.4 2.9 3.5 4.1 5.1

a) A taxa de escoamento de C2F 6 afeta a uniformidade do ataque químico? Faça uma análise de variância. Use = 0,05.

COELM – Estatística – Marcio Bennemann54


04- . Um grupo de 12 pacientes internados na Enfermaria de Clínica Médica apresentou níveis médios de potássio sérico de 4.8 mEqs, com desvio padrão de
0.4. Outros 12 pacientes de outra enfermaria apresentaram média de 5.1 mEqs e desvio de 0.36. Pode-se concluir que o nível sérico de potássio do segundo
grupo é maior do que o do primeiro, se adotarmos os níveis de significância de 1% e 5%?

COELM – Estatística – Marcio Bennemann55


P(x) = probabilidade de ocorrer x sucessos

P(x) = Cnx . px . ( 1 – p )n – x

x− µ
A variável reduzida z =
ο
s
µ = x ± t.s x sx =
n
p.(1 − p )
sp = P = p ± z.s p
n

z 2 .s 2
no = n 0 .N
E 20 n=
n0 + N

z 2 . p.(1 − p ) n 0 .N
n0 = n=
E0
2
n0 + N

_ _ _ _ _
LSC = x + A. R LM = x LIC = x − A. R

_ _ _
LSC = D4 . R LM = R LIC = D3 . R

∑ x.∑ y
∑ xy − n
r =

∑ x 2 −
(∑ x ) 2

 . ∑ y 2 −
(∑ y ) 2




n 
 
n 

∑ x.∑ y
∑ xy −
n _ _
b= y = a + bx
(∑ x) 2 a = y − b. x
∑ x2 −
n

x1 − x 2
(n1 − 1) s12 + (n 2 − 1) s 22 t=
Sa = 1 1
gl Sa +
n1 n 2

COELM – Estatística – Marcio Bennemann56


_
_ _
_
n . x + n . x + ... + nn . x n
x= 1 1 2 2
n1 + n2 + ... + nn

n1 ⋅ ( x1 − x ) 2 + n2 ⋅ ( x2 − x ) 2 + n3 ⋅ ( x3 − x ) 2 + ... + nn ⋅ ( xn − x ) 2
MQE =
k−1

k = n.0 de grupos

(n1 − 1) ⋅ s12 + ( n2 − 1) ⋅ s22 + (n3 − 1) ⋅ s32 + ... + (nn − 1) ⋅ sn2


MQD =
n1 + n2 + n3 + ... + nn − k

MQE
F=
MQD

COELM – Estatística – Marcio Bennemann57


COELM – Estatística – Marcio Bennemann58
COELM – Estatística – Marcio Bennemann59
Tabela para a distribuição chi-quadrado

A primeira coluna da tabela contém valores inteiros para o grau de liberdade ν da distribuição.
Os valores numéricos do cabeçalho (primeira linha) indicam as áreas à direita para os valores de x nas colunas
correspondentes.

ν / A 0,995 0,990 0,975 0,950 0,900 0,750 0,500 0,250 0,100 0,050 0,025 0,010 0,005
01 0,000 0,000 0,001 0,004 0,016 0,102 0,455 1,323 2,706 3,841 5,024 6,635 7,879
02 0,010 0,020 0,051 0,103 0,211 0,575 1,386 2,773 4,605 5,991 7,378 9,210 10,597
03 0,072 0,115 0,216 0,352 0,584 1,213 2,366 4,108 6,251 7,815 9,348 11,345 12,838
04 0,207 0,297 0,484 0,711 1,064 1,923 3,357 5,385 7,779 9,488 11,143 13,277 14,860
05 0,412 0,554 0,831 1,145 1,610 2,675 4,351 6,626 9,236 11,071 12,833 15,086 16,750
06 0,676 0,872 1,237 1,635 2,204 3,455 5,348 7,841 10,645 12,592 14,449 16,812 18,548
07 0,989 1,239 1,690 2,167 2,833 4,255 6,346 9,037 12,017 14,067 16,013 18,475 20,278
08 1,344 1,647 2,180 2,733 3,490 5,071 7,344 10,219 13,362 15,507 17,535 20,090 21,955
09 1,735 2,088 2,700 3,325 4,168 5,899 8,343 11,389 14,684 16,919 19,023 21,666 23,589
10 2,156 2,558 3,247 3,940 4,865 6,737 9,342 12,549 15,987 18,307 20,483 23,209 25,188
11 2,603 3,053 3,816 4,575 5,578 7,584 10,341 13,701 17,275 19,675 21,920 24,725 26,757
12 3,074 3,571 4,404 5,226 6,304 8,438 11,340 14,845 18,549 21,026 23,337 26,217 28,300
13 3,565 4,107 5,009 5,892 7,042 9,299 12,340 15,984 19,812 22,362 24,736 27,688 29,819
14 4,075 4,660 5,629 6,571 7,790 10,165 13,339 17,117 21,064 23,685 26,119 29,141 31,319
15 4,601 5,229 6,262 7,261 8,547 11,037 14,339 18,245 22,307 24,996 27,488 30,578 32,801
16 5,142 5,812 6,908 7,962 9,312 11,912 15,339 19,369 23,542 26,296 28,845 32,000 34,267
17 5,697 6,408 7,564 8,672 10,085 12,792 16,338 20,489 24,769 27,587 30,191 33,409 35,718
18 6,265 7,015 8,231 9,390 10,865 13,675 17,338 21,605 25,989 28,869 31,526 34,805 37,156
19 6,844 7,633 8,907 10,117 11,651 14,562 18,338 22,718 27,204 30,144 32,852 36,191 38,582
20 7,434 8,260 9,591 10,851 12,443 15,452 19,337 23,828 28,412 31,410 34,170 37,566 39,997
21 8,034 8,897 10,283 11,591 13,240 16,344 20,337 24,935 29,615 32,671 35,479 38,932 41,401
22 8,643 9,542 10,982 12,338 14,041 17,240 21,337 26,039 30,813 33,924 36,781 40,289 42,796
23 9,260 10,196 11,689 13,091 14,848 18,137 22,337 27,141 32,007 35,172 38,076 41,638 44,181
24 9,886 10,856 12,401 13,848 15,659 19,037 23,337 28,241 33,196 36,415 39,364 42,980 45,559
25 10,520 11,524 13,120 14,611 16,473 19,939 24,337 29,339 34,382 37,652 40,646 44,314 46,928
26 11,160 12,198 13,844 15,379 17,292 20,843 25,336 30,435 35,563 38,885 41,923 45,642 48,290
27 11,808 12,879 14,573 16,151 18,114 21,749 26,336 31,528 36,741 40,113 43,195 46,963 49,645
28 12,461 13,565 15,308 16,928 18,939 22,657 27,336 32,620 37,916 41,337 44,461 48,278 50,993
29 13,121 14,256 16,047 17,708 19,768 23,567 28,336 33,711 39,087 42,557 45,722 49,588 52,336
30 13,787 14,953 16,791 18,493 20,599 24,478 29,336 34,800 40,256 43,773 46,979 50,892 53,672

2
Exemplo 01: seja uma distribuição χ com 10 graus de liberdade. Na linha ν = 10 e coluna A = 0,100 encontra-se 15,987.

COELM – Estatística – Marcio Bennemann60

Vous aimerez peut-être aussi