Académique Documents
Professionnel Documents
Culture Documents
Mdulo I
Conceitos Bsicos
Estatstica uma coleo de mtodos (instrumentos) para o planejamento de experimentos,
obteno de dados e, consequente organizao, resumo, apresentao, anlise, interpretao,
elaborao de concluses e tomadas de decises baseadas nos dados.
Estatstica Descritiva a parte da estatstica que descreve os aspectos importantes de um
conjunto de dados.
Inferncia Estatstica usa uma amostra para fazer generalizaes a respeito de aspectos
importantes de uma populao.
Dados so observaes que tenham sido coletados.
Ex.: Os tempos, em dias, da deteco de um primeiro defeito nos compressores, modelo W1, produzidos
pela empresa X9, no ano de 2006.
Tipos de Dados
Parmetros uma medida numrica que descreve alguma caracterstica de uma populao.
Ex. A mdia das notas de clculo vetorial de todos os acadmicos da UDESC.
Estatstica uma medida numrica que descreve alguma caracterstica de uma amostra.
Ex. A mdia das notas de clculo vetorial de uma amostra aleatria dos acadmicos da UDESC.
Dados Contnuos resultam de infinitos valores possveis que correspondem a alguma escala
contnua que cobre um intervalo de valores sem vazios, interrupes ou saltos.
Ex: A estatura dos moradores (em metros): 1,67; 1,56; 1,72; .....
Pgina 1
Planejamento de Experimentos
Os mtodos estatsticos so direcionados pelos dados. Normalmente, obtemos dados de duas
fontes distintas: estudos observacionais e experimentos.
Estudo Observacional observamos e medimos caractersticas especficas, mas no tentamos
modificar os sujeitos objeto de estudo, O Estudo Observacional pode ser:
Estudo Transversal os dados so observados, medidos e coletados em um
determinado tempo presente.
Ex.: coleta das notas da primeira avaliao de estatstica das turmas de engenharia do semestre em curso.
Aleatoriedade
Amostra Aleatria membros de uma populao so selecionados de tal modo que cada
membro individual tenha chance igual de ser selecionado.
Amostra Aleatria Simples de tamanho n selecionada de tal modo que toda amostra
possvel de mesmo tamanho n tem a mesma chance de ser escolhida.
Pgina 2
Erros Amostrais
Erro Amostral a diferena entre o resultado amostral e o verdadeiro resultado da
populao. Tais erros resultam das flutuaes amostrais devidas ao acaso.
Erro no-amostral ocorre quando os dados amostrais so coletados ou registrados ou
analisados incorretamente (tal como a seleo de uma amostra tendenciosa, o uso de um
instrumento de medida defeituoso, ou cpia incorreta dos dados).
Pgina 3
Mdulo II
Estatstica Descritiva
Apresenta as ferramentas bsicas para a medio e descrio de diferentes caractersticas de
um conjunto de dados.
Podemos ter a medio ao descrio das diferentes caractersticas dos dados a partir de
distribuies de frequncias, grficos ou medidas.
Distribuio de Frequncia
As distribuies de frequncia so construdas pelas seguintes razes: (1) grandes conjuntos de
dados podem ser resumidos, (2) podemos obter alguma compreenso sobre a natureza dos
dados, e (3) temos uma base para construir grficos importantes. A distribuio de frequncia
lista os valores dos dados (individualmente ou por grupos de intervalos), juntamente com suas
frequncias correspondentes (ou contagens).
Vida til de betoneiras eltricas
Semanas de uso
0 99
100 199
200 - 299
300 - 399
400 - 499
Total
Frequncia
11
12
14
1
2
40
Pgina 4
Pgina 5
Exerccio de Aula
1 Identifique a amplitude de classe, os pontos mdios das classes e as fronteiras de classe
para a distribuio de frequncia abaixo
Presso Sangunea Sistlica
90 -99
100 109
110 119
120 129
130 139
140 149
150 - 159
Frequncia Simples
1
4
17
12
5
0
1
Pgina 6
Modulo II
Estatstica Descritiva
Medidas de Tendncia Central
Medida de Centro ou de Centralidade- um valor no centro ou meio do conjunto de dados.
Principais Medidas de Centro:
Mdia;
Mediana;
Moda;
Ponto Mdio.
Mdia a mais importante das medidas numricas usadas para descrever dados, considera,
em seu clculo, todos os valores da amostra ou da populao que est sendo estudada. .
Mdia Aritmtica a medida de centro encontrada pela adio dos valores e diviso do total
pelo nmero de valores.
Frmula:
referente populao
referente amostra
Onde,
indica a adio de um conjunto de valores.
x a varivel, em geral usada para representar os valores individuais dos dados.
n representa o nmero de valores de uma amostra,
N representa o nmero de valores em uma populao.
Pgina 7
Mediana a medida de centro que o valor do meio quando os dados esto arranjados em
ordem crescente (ou decrescente) de magnitude
Para se encontrar a mediana, primeiro ordene os valores e depois siga um dos procedimentos:
1 Se o numero de valores for impar, a mediana ser o numero localizado no meio
exato da lista.
2 Se o numero de valores for par, a mediana ser encontrada pelo calculo da mdia
dos dois nmeros do meio.
Moda o valor que ocorre mais frequentemente.
Quando dois valores ocorrem com a mesma maior freqncia, cada um uma
moda, e o conjunto de dados bimodal.
Quando mais de dois valores ocorrem com a mesma maior freqncia, cada
um uma moda, e o conjunto de dados multimodal.
Quando nenhum valor se repete, dizemos que no h moda.
Ponto Mdio a medida de centro que exatamente o valor a meio caminho entre o maior
e o menor valor no conjunto original de dados.
Assimetria uma distribuio de dados assimtrica quando se estende mais para um lado do
que para o outro.
Exerccio em Aula
1 - Para os exerccios abaixo, encontre a mdia, a mediana, a moda e o ponto mdio para cada
uma das duas amostras apresentadas e tea algum comentrio sobre o resultado encontrado.
a Tempo de espera de clientes nas filas de caixa das instituies financeiras A e B
Banco A (fila nica): 6,5 6,6 6,7 6,8 - 7,1 7,3 7,4 7,7 7,7 - 7,7
Banco B (trs filas): 4,2 5,4 5,8 6,2 6,7 7,7 - 7,7 - 8,5 9,3 - 10,0
b Largura mxima de crnios de homens egpcios de 4000 a.C. a 150 d.C.
4000 a.C. : 131 119 138 125 129 126 131 132 126 128 128 131
Prof. Murilo Carvalho
Pgina 8
Pgina 9
Modulo II
Estatstica Descritiva
Medidas de Tendncia Central
Outras Medidas de Tendncia Central
Mdia Truncada ou Aparada uma mdia mais resistente a distores por valores extremos.
Para achar a mdia truncada de 10% de um conjunto de dados, primeiro ordene os dados,
despreze os 10% valores inferiores e os 10% dos valores superiores e depois calcule a mdia
aritmtica.
Caso no se consiga um nmero exato de observaes (15% de 10 observaes), ento,
calcula-se a mdia com as duas porcentagens mais prximas. (10% de 10 observaes) .
Mdia Harmnica , em geral, usada como medida de tendncia central para conjuntos de
dados que consistem em taxas de variao, tais como velocidade.
Exerccio
1 Para os dados referente ao exerccio 1 e 2 da pagina 8, (a) calcule a mdia aparada de 10%;
(b) a mdia aparada de 20%?
2 Um veculo se desloca entre trs cidades equidistantes A, B e C, retornando a
primeira. Entre a cidade A e B ele se desloca 30 km/h, entre B e C 40 km/h e entre
C e A a 50 km/h. Qual a velocidade mdia em todo o trecho percorrido.
Pgina 10
Pgina 11
Modulo II
Estatstica Descritiva
Medidas de Variao
Mede a disperso dos dados em relao a um valor mdio.
Principais medidas de disperso:
Amplitude;
Desvio Mdio Absoluto;
Desvio Padro;
Varincia.
Amplitude a diferena entre o maior e o menor valor de um conjunto de dados.
AT (Amplitude Total) = maior valor menos valor
Desvio Mdio Absoluto a distncia mdia dos dados at a sua mdia aritmtica,
considerando os valores absolutos.
O desvio padro absoluto usa uma operao que no algbrica (valor absoluto) criando
dificuldades algbricas nos mtodos de inferncia estatstica.
Desvio Padro uma medida da variao dos valores em torno da media. uma espcie de
desvio mdio em relao media.
Pgina 12
Varincia Populacional
Amostra
Populao
Exerccio de Aula
1 - Para os exerccios abaixo, encontre a amplitude, o desvio mdio, o desvio padro e a
varincia para cada uma das duas amostras e o coeficiente de variao para o par de amostras
apresentadas e tea algum comentrio sobre o resultado encontrado.
a Tempo de espera de clientes nas instituies financeiras A e B
Banco A : 6,5 6,6 6,7 6,8 - 7,1 7,3 7,4 7,7 7,7 - 7,7
Banco B : 4,2 5,4 5,8 6,2 6,7 7,7 - 7,7 - 8,5 9,3 - 10,0
b Largura mxima de crnios de homens egpcios de 4000 a.C. a 150 d.C.
4000 a.C. : 131 119 138 125 129 126 131 132 126 128 128 131
150 d.C. : 136 130 126 126 139 141 137 138 133 131 134 - 129
Pgina 13
Modulo II
Estatstica Descritiva
Medidas de Posio
So medidas que permitem comparar valores de conjuntos de dados diferentes, ou comparar
valores dentro de um mesmo conjunto de valores.
Escore z o nmero de desvio padres qa que se situa determinado valor de x acima ou
abaixo da mdia.
Amostra
Populao
Exerccio de Aula
1 - Para o exerccio 1 da pgina 11, encontre o escore z dos valores solicitados.
a Tempo de espera de clientes nas instituies financeiras A e B
Banco A : 6,5
Banco B : 6,5
b Largura mxima de crnios de homens egpcios de 4000 a.C. a 150 d.C.
4000 a.C. : 130
150 d.C. : 130
2 Para o exerccio 2 da pgina 11, encontre o valor de uma medio que est posicionada em
z = -2,56
Pgina 14
Modulo II
Estatstica Descritiva
Representao Pictogrfica
O grfico estatstico uma forma de apresentao dos dados estatsticos que visa produzir no
pblico uma impresso mais viva e rpida do fenmeno estudado. Por sua finalidade, os
grficos devem ser simples, claros e trazer informaes verdicas. Os principais tipos de
grficos estatsticos so:
Grfico de Colunas
Grfico de Barra
Pgina 15
Grfico de Pizza
Pgina 16
Modulo III
Probabilidade
Probabilidade a base sobre a qual so construdos importantes mtodos de inferncia
estatstica.
Conceitos Bsicos
Evento qualquer conjunto de resultados de um experimentos.
Evento Simples um resultado ou um evento que no pode mais ser decomplosto em
componentes mais simples.
Espao Amostral consiste em todos os eventos simples possveis. Isto , o espao amostral
consiste em todos os resultados que no podem mais ser decompostos.
Pgina 17
Regra da Adio
uma ferramenta que permite expressar como P(A ou B), a probabilidade de que ou o evento
A ocorre ou o evento B ocorre (ou ambos ocorrem) como um nico resultado de um
experimento.
Notao para Regra de Adio
Regra da Multiplicao
uma ferramenta que envolve a multiplicao de probabilidades e que, algumas vezes,
teremos que ajustar a probabilidade do evento B para refletir a ocorrncia do evento A
Notao para Multiplicao
P(A e B) = P(evento A ocorrer na primeira prova e evento B ocorrer na segunda prova)
Prof. Murilo Carvalho
Pgina 18
Exerccio de Aula
1 Uma empresa possui trs mquinas, denominadas A, B e C. Elas possuem,
respectivamente, 10%, 25% e 50% de chance de apresentar algum tipo de problema ao longo
deste ano. Qual a chance delas:
a) no apresentarem problemas ao longo deste ano?
b) As trs apresentarem problemas ao longo deste ano?
c) Apenas a primeira apresentar problema ao longo deste ano?
2 Para o exemplo 2 da regra de multiplicao, calcule a probabilidade de o apostador acertar
a) a quadra; b) a quina no jogo de mega sena?
Pgina 19
Modulo IV
Distribuio de Probabilidade Discreta
Distribuio de Probabilidade um grfico, uma tabela ou frmula que d a probabilidade
para cada valor da varivel aleatria.
Varivel aleatria uma varivel (normalmente representada por x) que tem um nico valor
numrico, determinado por acaso, para cada resultado de um experimento.
Varivel aleatria discreta tem ou um nmero finito de valores, ou uma quantidade
enumervel de valores, onde, enumervel se refere ao fato de que podem existir infinitos
valores, mas que podem ser associados a um processo de contagem.
Varivel aleatria contnua tem infinitos valores, e esses valores podem ser associados com
medidas em uma escala contnua, de modo que no h pulos ou interrupes.
Requisitos para uma distribuio de probabilidade
1. P(x) = 1 onde x assume todos os valores possveis;
2. 0p(x)1 para todo valor individual de x.
Valor Esperado
O valor esperado de uma varivel aleatria discreta designado por E e representa o valor
mdio dos resultados. obtido pelo clculo de
.
Principais Distribuies de Probabilidade
Distribuies de Probabilidade Discretas
Binomial;
Geomtrica;
Hipergeomtrica;
Multinomial; e
Poisson.
Uniforme;
Normal;
Pgina 20
onde,
P(x) representa a probabilidade de se obterem exatamente x sucessos em n tentativas.
n = representa o nmero fixo de tentativas;
x = representa o numero especfico de sucessos em n tentativas, de modo que x pode
ser qualquer nmero inteiro entre 0 e n, inclusive.
P = representa a probabilidade de sucesso em uma das n tentativas.
q = representa a probabilidade de fracasso em uma das n tentativas.
A palavra sucesso no representa, necessariamente, algo bom.
Exerccios
1 A Air America tem uma poltica de reservar lugar para 15 pessoas em um avio no qual
podem se sentar apenas 14 pessoas. Estudos passados mostraram que apenas 85% dos
passageiros agendados realmente se apresentam para o vo. Ache a probabilidade de que a
Air America reserve lugar para 15 pessoas, e que no haja lugar suficiente para todos?
2 A companhia telktronic compra grandes carregamentos de lmpadas e usa o seguinte
plano de amostragem de aceitao: seleciona aleatoriamente e testa 24 lmpadas, e aceita o
lote todo se h apenas uma ou nenhuma lmpada que no funcione. Se um carregamento de
milhares de lmpadas tem uma taxa de 4% de defeituosas, qual a probabilidade de que o
carregamento todo seja aceito.
3 Pesquisa interna paga por uma determinada empresa de vendas pela internet, mostram
que mesmo as empresas mais corretas apresentam 15% de reclamaes nos seus processos de
entrega. Suponha que voc esteja testando tal empresa fazendo 10 pedidos, tambm
considere que esta empresa apresenta, historicamente, o mesmo percentual de reclamaes
a) Ache a probabilidade de se obter uma reclamao.
b) Ache a probabilidade de se obter, no mximo, uma reclamao.
Prof. Murilo Carvalho
Pgina 21
Pgina 22
Onde e 2,71828
A distribuio de Poisson tem os seguintes requisitos:
a) A varivel aleatria x o nmero de ocorrncias de um evento ao longo de algum
intervalo;
b) As ocorrncias devem ser aleatrias;
c) As ocorrncias devem ser independentes uma das outras.
Pgina 23
Pgina 24
Modulo V
Distribuio de Probabilidade Contnua
Distribuio de Probabilidade Uniforme
Uma varivel aleatria contnua tem uma distribuio uniforme se seus valores se espalham
uniformemente sobre a faixa de possibilidades. O grfico de uma distribuio uniforme resulta
em uma forma retangular.
A curva de densidade da distribuio uniforme uma reta horizontal; assim fcil achar a rea
de qualquer regio retangular: multiplique a largura pela altura.
Distribuio Normal Padro e No Padronizada
A Distribuio Normal Padro uma distribuio de probabilidade normal que tem mdia 0 e o
desvio padro 1, e a rea total sob a curva de densidade 1. Abaixo temos uma
representao, primeiramente de uma distribuio no padronizada (de mdia 8,2 e desvio
padro de 1,34), e; em seguida a de uma distribuio padronizada de mdia 0 e desvio padro
1). Na prtica a aplicao direta de uma distribuio normal padronizada no seria to til. O
ideal e que possamos converter uma distribuio no padronizada (resultados comumente
encontrados no nosso dia a dia) em uma distribuio padronizada, que nos permitir efetuar
clculos rpidos, principalmente atravs de tabelas pr-elaboradas.
A curva de densidade de uma distribuio normal tem forma de sino mais complicada, de
modo que mais difcil achar reas, mas o princpio o mesmo da distribuio uniforme: h
uma correspondncia entre rea e probabilidade.
Pgina 25
Usando a tabela do escore z (pagina seguinte), podemos achar essas reas (ou probabilidades)
para muitas regies diferentes, o processo simples e esta descrito abaixo.
O exemplo abaixo proposto requer que achemos a probabilidade associada a um valor menor
que 1,58. Comece com o escore z de 1,58, localizando 1,5 na coluna a esquerda; em seguida
ache o valor na linha adjacente de probabilidade que esta exatamente abaixo de 0,08.
O valor da rea (ou probabilidade) de 0,4429 indica que h uma probabilidade de 0,4429 (ou
uma porcentagem de 44,29%) de selecionarmos aleatoriamente um escore z entre 0 e 1,58.
z
. . . . . . . . . . .. . . . . . .0,08
1,5
. . . . . . . . . . . . . . . . . 0,4429
Pgina 26
Pgina 27
Exerccios de Aula
Pgina 28
Pgina 29
Modulo V
Distribuio de Probabilidade Contnua
Distribuio Amostral das Mdias
A Distribuio Amostral da Mdia a distribuio de probabilidade das mdias amostrais, com
todas as amostras tendo o mesmo tamanho amostral n.
Vejamos o exemplo da tabela abaixo. Considere uma populao com trs valores: 1; 2 e 5.
Vamos ento calcular a mdia e o desvio padro da populao (1; 2 e 5) e tambm a mdia e
desvio padro de todas as mdias e desvios padres gerados pelas amostras de dois
elementos retiradas da populao em questo.
Amostra
(02 elementos)
1;1
1;2
1;5
2;1
2;2
2;5
5;1
5;2
5;3
Mdia dos Valores da
Estatstica
Parmetro Populacional
A estatstica amostral
atinge
o
alvo
do
parmetro populacional?
Mdia
(X)
1,0
1,5
3,0
1,5
2,0
3,5
3,0
3,5
5,0
2,7
Desvio Padro
(s)
0,000
0,707
2,828
0,707
0,000
2,121
2,828
2,121
0,000
1,3
2,7
Sim
1,7
No
Pgina 30
Tambm o desvio padro das mdias amostrais seguido por x, de modo que
Exerccios de Aula
1 - O gerente de uma grande rede de lojas esta preocupado com o fato de que seus
fornecedores lhe entreguem aparelhos de TV com nvel de qualidade inferior a mdia. Sua
pesquisa mostra que o tempo de substituio dos aparelhos tem uma mdia de 8,2 anos e um
desvio padro de 1,1 ano. Ele seleciona 50 aparelhos vendidos e descobre que o tempo mdio
de substituio de 7,8 anos.
a) Supondo que os tempos de substituio de aparelhos de TV tenham uma mdia de 8,2
anos e um desvio padro de 1,1 ano, ache a probabilidade de 50 aparelhos
selecionados aleatoriamente terem um tempo de substituio de 7,8 anos ou menos?
b) Com base no resultado h evidncia de que a rede recebeu aparelhos de TV com
qualidade inferior a qualidade mdia?
2 A cidade de Newport opera um depsito de lixo que fica sobrecarregado se as 4872 casas
da cidade descarregar lixo com pesos com mdia superior a 13,88 Kg em uma semana. Por
varias semanas diferentes, resultou que amostras de 472 casas tm pesos normalmente
Prof. Murilo Carvalho
Pgina 31
Pgina 32
Modulo VI
Estimativas e Tamanhos Amostrais
Estimativa Pontual um nico valor para aproximar um parmetro populacional.
Estimativa Intervalar um intervalo de valores usado para estimar o verdadeiro valor de um
parmetro populacional.
Nvel de Confiana a probabilidade 1 (em geral, expressa o valor equivalente em
porcentagem) que a proporo de vezes que o intervalo de confiana realmente contm o
parmetro populacional, supondo que o processo de estimao seja repetido um grande
nmero de vezes. O nvel de confiana tambm chamado de grau de confiana ou
coeficiente de confiana.
Valor Crtico um numero na fronteira que separa estatsticas amostrais que tem chance de
ocorrer daqueles que no tm. O nmero z/2 um valor crtico que um escore z com a
propriedade de separar uma de /2 na cauda direita de distribuio normal padronizada.
Quadro de valores crticos mais comuns.
Nvel de Confiana
90%
0,10
1,645
95%
0,05
1,96
99%
0,01
2,575
Pgina 33
Pgina 34
Modulo VI
Estimativas e Tamanhos Amostrais
Estimativa da Mdia Populacional
Onde:
z/2
Pgina 35
Pgina 36
Modulo VI
Teste de Hiptese
Hiptese - uma afirmativa sobre uma propriedade da populao
Teste de Hiptese um procedimento padro para testar uma afirmativa sobre uma
propriedade da populao.
Regra do evento raro para a inferncia estatstica
Se, sob uma dada suposio, a probabilidade de um evento observado particular
excepcionalmente pequena, conclumos que a suposio provavelmente no correta.
Componentes de um teste de hiptese formal
Hiptese Nula e Alternativa
Hiptese Nula (representada por Ho) uma afirmativa do que o valor de um parmetro
populacional igual a algum valor especificado.
Ho:p=0,5
Ho:=98,6
Testamos a hiptese nula diretamente, no sentido de que supomos que ela seja verdadeira e
chegamos a uma concluso para rejeitar Ho ou deixar de rejeitar Ho.
Hiptese Alternativa da Nula (representada por H1 a afirmativa de que o parmetro tem um
valor que, de alguma forma, difere da hiptese nula.
H1:p
H1:
H1:p
H1:
H1:p
H1:
Estatstica de Teste um valor calculado a partir dos dados amostrais e usada para se
tomar a deciso sobre a rejeio da hiptese nula. A estatstica de teste encontrada pela
converso da estatstica amostral em um escore z com a suposio de que a hiptese nula seja
verdadeira.
Estatstica de Teste para proporo
Regio Critica o conjunto de todos os valores da estatstica de teste que nos fazem rejeitar
a hiptese nula.
Pgina 37
Modulo VII
Correlao e Regresso
Correlao _ existe uma correlao entre duas variveis quando uma delas est relacionada com a outra
de alguma maneira.
Diagrama de disperso um grfico no qual os dados amostrais emparelhados so plotados com um
eixo horizontal x e um eixo vertical y. Cada par individual (x,y) plotado como um nico ponto.
Coeficiente de Correlao Linear (r) mede a intensidade da relao linear entre os valores
quantitaitvos emparelhados x e y em uma amostra. Seu valor calculado usando a formula
abaixo.
Pgina 38
Pgina 39
Regresso a descrio da relao entre duas variveis atravs do grfico e da equao que
representam a relao.Esta reta chamada de reta de regresso, e sua equao chamada de
equao da regresso.
A equao da regresso expressa uma relao entre x (chamada de varivel independente, ou
varivel preditora, ou varivel explanatria) e
resposta)
Onde,
As equaes de regresso podem ser teis para predizer o valor de uma varivel, dado algum
valor particular de outra varivel.Se a reta de regresso se ajusta bem aos dados, ento faz
Pgina 40
Exerccio:
87
67
93
99
45
20
44
60
66
17
13
19
21
18
15
10
13
15
Segundo grupo
Umidade
mdia
relativa no
ar (x)
Vida til
anos (y)
89
87
67
93
99
45
20
44
60
66
18
22
18
17
15
25
30
25
23
15
Pergunto:
a) Quais os coeficientes de correlao linear (r) de cada um dos grupos?
b) H correlao linear entre as variveis para cada um dos grupos?
c) Qual grupo possui a melhor correlao?
d) Desenvolva a equao de regresso para o grupo de melhor correlao.
e) Qual a predio de vida til para um equipamento instalado em uma regio onde a
unidade relativa do ar mdia de 40%
Pgina 41