Vous êtes sur la page 1sur 9

1

PUCRS FAMAT DEPT DE ESTATSTICA Probabilidade / Amostragem / Estimao - Prof. Srgio Kato

1. Probabilidade: Experimentos Aleatrios: So experimentos cujos resultados variam de uma observao para a outra, mesmo quando mantidas as condies de experimentao. Caractersticas: 1. Cada experimento aleatrio poder ser repetido indefinidamente sob as mesmas condies. 2. No se conhece um particular valor do experimento antes que este ocorra, porm, conhecemos todos os possveis resultados. 3. Quando repetimos um experimento um grande nmero de vezes, surge uma regularidade. Espao Amostral (S ou ): o conjunto de todos os resultados possveis de um experimento aleatrio. O espao amostral com um nmero finito ou infinito enumervel de valores dito espao discreto, e o espao amostral com um nmero infinito no-enumervel de pontos dito espao contnuo. Eventos Aleatrios: So os resultados possveis de cada experimento aleatrio. Um evento , portanto, um subconjunto do espao amostral. Os eventos so denotados por letra maiscula. Definio Clssica de Probabilidade: Seja A um evento de S. Ento, a probabilidade de A ocorrer dada por
P(A) = h n

onde h: nmero de resultados favorveis ao evento A n: nmero total de resultados. Propriedades da Probabilidade: Seja A um evento de S 1. 0P(A)1. 2. Se A o complemento de A, ento, P(A) = 1 -P(A) 3. Se A e B so dois eventos quaisquer, ento, P(AB)= P(A)+P(B)-P(AB)

Distribuio Normal: Seja X uma v.a.c. tal que E(X)= e Var(X)= 2 , onde < x < + e >0. Ento, X tem distribuio Normal com mdia e varincia 2 , se sua funo densidade de probabilidade dada por:
f ( x) = 1 2 2 ( x ) e 2 2

Notao: X~N( ; )

Distribuio Normal Padro: Seja X uma v.a.c. tal que X~N( ; ). Ento, a v.a.c. Z =
X -

tem distribuio Normal com mdia 0 (zero) e desvio padro 1 (um), isto , Z~N(0;1). A funo densidade de Z dada por:
- z2 1 2 e 2

f(z) =

P(Z<z)= ver direto na tabela P(Z>z)= 1- P(Z<z) P(z1<Z<z2)= P(Z<z2)- P(Z<z1)

2. Amostragem:
Inferncia

Populao N (Parmetros)

Amostra n (Estatsticas)

Representatividade

3
Amostragem: Processo de obteno de amostras, geralmente com o objetivo de fazer inferncia. A amostragem pode ser feita com ou sem reposio. Para amostragem com reposio, o nmero de amostras possveis de tamanho n n dado por Nn e, para amostragem sem reposio, por CN . Algumas razes para o uso de amostras: 1. Minimizao de custos, quando preciso absoluta no necessria. 2. Economia de tempo, quando h necessidade de resultados mais rpidos do que seria possvel com um censo. 3. Permite concentrar a ateno em casos individuais. 4. Na indstria, alguns testes so destrutivos e s podem ser feitos com uma amostra de produtos. 5. Em populaes infinitas (exemplo: experimento agrcola para testar fertilizantes). 6. Onde os erros no relacionados amostra so grandes, uma amostra pode dar melhores resultados que um censo. Os erros no amostrais so mais fceis de controlar em operaes de pequena escala. PRINCIPAIS TIPOS DE AMOSTRAGEM
- AMOSTRAGEM NO PROBABILSTICA - AMOSTRAGEM PROBABILSTICA

Amostragem acidental Amostragem intencional Amostragem por quotas

Amostragem aleatria simples Amostragem sistemtica Amostragem estratificada Amostragem por conglomerados

AMOSTRAGEM NO PROBABILSTICA So amostragens em que h uma escolha deliberada dos elementos da amostra. No possvel generalizar os resultados das pesquisas para a populao, pois as amostras no-probabilsticas no garantem a representatividade da populao.

Amostragem acidental Trata-se de uma amostra formada por aqueles elementos que vo aparecendo, que so possveis de se obter at completar o nmero de elementos da amostra. Geralmente utilizada em pesquisas de opinio, em que os elementos entrevistados so acidentalmente escolhidos. Amostragem intencional De acordo com determinado critrio, escolhido intencionalmente um grupo de elementos que iro compor a amostra. O investigador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinio. Exemplo: pesquisa sobre preferncia por determinado cosmtico, o pesquisador se dirige a um grande salo de beleza e entrevista as pessoas que ali se encontram.

Amostragem por quotas Um dos mtodos de amostragem mais utilizado em levantamentos de mercado e em pesquisas eleitorais o mtodo de amostragem por quotas. Ele abrange trs fases: 1a. fase- Classificao da populao em termos de propriedades que se sabe, ou presume, serem relevantes para a caracterstica a ser estudada; 2a. fase- Determinao da proporo populacional para cada caracterstica, com base na constituio conhecida, presumida ou estimada, da populao; e 3a. fase- Fixao de quotas para cada observador ou entrevistador a quem tocar a responsabilidade de selecionar interlocutores ou entrevistados, de modo que a amostra total observada ou entrevistada contenha a proporo de cada classe tal como determinada anteriormente. AMOSTRAGEM PROBABILSTICA O mtodo de amostragem probabilstica exige que cada elemento da populao possua probabilidade diferente de zero de ser selecionado e conseqentemente s ser possvel se a populao for finita e acessvel. Trata-se do mtodo que garante cientificamente a aplicao das tcnicas estatsticas de inferncia. Somente com base em amostras probabilsticas que podem ser feitas inferncias sobre a populao a partir do conhecimento da amostra. Amostragem Aleatria Simples Processo mais elementar e utilizado onde cada elemento da populao possui a mesma probabilidade de pertencer a amostra. Atribui-se a cada elemento da populao um nmero distinto. Efetuam-se sucessivos sorteios at completar-se o tamanho da amostra: n. Para realizar os sorteios, pode ser utilizada uma tabela de nmeros aleatrios, que consiste em uma tabela que apresenta seqncias dos dgitos de 0 a 9 distribudos aleatoriamente. Pode ser utilizada tambm a funo aleatria da calculadora ou do computador Tabela de nmeros aleatrios
6662 2248 6710 2844 5727 3056 5965 8377 9296 5337 4856 1750 9056 6429 1134 2665 9104 9442 5493 4568 5731 7467 3238 3724 232 7292 9815 1014 9376 2257 6783 7284 5153 8527 2002 9769 4846 8112 710 6014 3213 1909 251 7283 6728 6494 2331 7488 2992 7223 2362 4831 1797 603 1184 3802 3934 6260 4973 9082 1084 8305 8908 9059 8184 2809 9618 2052 8601 8515 1003 3676 2189 8919 807 2128 3147 2520 7768 2276 8322 544 7163 5772 9852 5654 360 5246 6511 3394 8774 4722 4869 7305 2107 2586 4185 2960 8543 7522

Mnimo 0000

Mximo 9999

Ex: populao com 1.000 elementos (N=1.000), pode-se numer-los de 000 a 999. Escolhendo uma posio de qualquer linha da tabela de nmeros aleatrios, faz-se o sorteio, ou seja, retiram-se conjuntos de trs algarismos para se escolherem os elementos que comporo a amostra.

5
Assim, imagine-se que a seqncia de dgitos aleatrios seja: 385 559 555 432 886 ... logo, os elementos de nmero 385 559 555 432 ... sero os componentes da amostra. Se o nmero sorteado superar o maior nmero dos elementos rotulados, abandona-se o nmero sorteado, prosseguindo-se o processo. Se o nmero sorteado for repetido, convm abandon-lo (caracterizando amostragem sem reposio). Amostragem Sistemtica Trata-se de uma variao da amostragem aleatria simples, conveniente quando a populao est ordenada segundo algum critrio, como fichas em um fichrio, listas telefnicas. Calcula-se o incremento de amostragem a=N/n aproximando-o para o inteiro mais prximo: a. Utilizando-se a tabela de nmeros aleatrios, sorteia-se um nmero x entre 1 e a , formando-se a amostra dos elementos correspondentes aos nmeros x; x + a; x + 2 a; ... e assim por diante. Exemplo: amostragem sistemtica Seja N =1.000, n = 200. Logo: a = N/n = 1.000/200 = 5 Imagine que trs seja o nmero sorteado entre 1 e 5. Portanto, os elementos da populao numerados por 3, 8 , 13, ... , 998 iro compor a amostra. OUTRO EXEMPLO: Seleo de uma amostra sistemtica de tamanho 10 dos 40 alunos abaixo
No.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Nome
Mrio Marisa Lcia Beth Joo Cristina Patrcia Ana Paula Jos Lisandra Teresa Joaquim Carolina Pedro Luciane Eliana Slvia Romeu Julieta

nota
0,5 0,0 2,0 4,0 2,0 8,0 4,5 8,5 6,0 1,5 1,0 6,5 4,5 2,5 6,5 1,5 0,5 5,0 2,5 9,0

No.
21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40

Nome
Jurema Otvio Clarice Jaqueline Fernanda Renato Paulo Lcio Jlia Regina Solange Alberto Marlene Gustavo Ricardo Juliana Francisca Rodrigo Rafael Jlio

nota
3,0 7,0 6,5 1,0 9,5 5,0 4,0 8,0 7,0 1,0 1,5 5,0 5,5 9,0 6,0 7,5 0,5 7,0 4,0 3,0

a=40/10=4 sorteando um nmero entre 1 e 4, digamos o 3 a primeira pessoa seria a pessoa 3 a prxima a 7 (3+4) e assim por diante at a 39

6
Os valores (notas dos alunos) sorteados foram: 2,0; 4,5; 1,0; 6,5; 2,5; 6,5; 4,0; 1,5; 6,0; 4,0 Mdia amostral: 3,85 amostra: 2,06 Varincia amostral: 4,23 Desvio-padro da

Enquanto que os parmetros populacionais eram: Mdia 4,44 Varincia 7,74 Desvio padro 2,78 Amostragem Estratificada No caso de populao heterognea em que se podem distinguir subpopulaes mais ou menos homogneas, denominadas estratos, possvel utilizar o processo de amostragem estratificada. Aps a determinao dos estratos, seleciona-se uma amostra aleatria de cada subpopulao (estrato). Se as diversas sub-amostras tiverem tamanhos proporcionais aos respectivos nmeros de elementos dos estratos, e guardarem proporcionalidade com respeito variabilidade de cada estrato, obtm-se uma estratificao tima. As variveis de estratificao mais comuns so: classe social, idade, sexo, renda, profisso ... ou qualquer outro atributo que revele os estratos dentro da populao. No exemplo da turma... Estratos para medir peso e altura: sexo,... Estratos para medir fatias de pizza: peso, altura e sexo,... Estratos para medir nota: curso, sexo,... Ex. Estratificao por sexo Populao apresenta 24 mulheres (60%) e 16 (40%) homens Queremos estimar o peso da turma, amostra de tamanho 20 Amostra de 10 mulheres apresentou mdia de 55,3 kg e dos 10 homens de de 81,0 kg A estimativa do peso mdio da turma uma mdia ponderada dos pesos: 55,3*0,6+81,0*0,4 = 65,6 Lembrar que o parmetro (Mdia populacional) era 64,9 kg. Amostragem Por Conglomerados Algumas populaes no permitem, ou tornam extremamente difcil que se identifiquem seus elementos. No obstante isso, pode ser relativamente fcil identificar alguns subgrupos da populao. Em tais casos, uma amostra aleatria simples desses subgrupos (conglomerados) pode ser colhida, e uma contagem completa pode ser feita para o conglomerado sorteado. Agregados tpicos so quarteires, famlias, organizaes, agncias, edifcios, etc.

Exemplo: num levantamento da populao de uma cidade, podemos dispor do mapa indicando cada quarteiro e no dispor de uma relao atualizada dos seus moradores. Pode-se, ento, colher uma amostra dos quarteires e fazer a contagem completa de todos os que residem naqueles quarteires sorteados.

3. Estimao: O objetivo da inferncia estatstica obter concluses a respeito de populaes atravs de uma amostra extrada dessa populao. Uma varivel aleatria caracterizada por sua distribuio de probabilidade. Em alguns casos, no controle estatstico da qualidade, por exemplo, a distribuio de probabilidade usada para descrever ou modelar alguma caracterstica de qualidade, como por exemplo, uma dimenso crtica de um produto ou a proporo de defeituosos de um processo de manufatura. Assim, estamos interessados em fazer inferncias a respeito dos parmetros da distribuio de probabilidade. Como estes parmetros quase sempre so desconhecidos, iremos estim-los a partir dos dados de uma amostra. A Estatstica Inferencial compreende a Estimao e os Testes de hipteses. A estimao um processo que consiste em utilizar dados amostrais (retirados segundo amostragem probabilstica) a fim de obter concluses sobre os parmetros da populao que so desconhecidos. A estimao pode ser feita por ponto ou por intervalo. Principais estimadores por ponto: Parmetro

2

Estimador
X S2

S P

ESTIMAO POR INTERVALO DE CONFIANA A estimao por intervalo nos fornece um intervalo de valores centrados na estatstica amostral, no qual julgamos estar o parmetro com uma probabilidade conhecida de erro. Vimos que para uma populao podemos retirar K amostras diferentes para um determinado tamanho de amostra n. Cada amostra possvel tem um valor como estimativa e cada estimativa fornecer um intervalo diferente para o parmetro. Assim, temos uma probabilidade (1-) de que o valor do parmetro esteja contido no intervalo estimado, chamado nvel de confiana. Por esta razo, chamamos de intervalos de confiana. O intervalo de confiana depender da distribuio amostral do estimador que foi utilizado para estimar o parmetro.

ESTIMAO POR INTERVALO PARA A MDIA POPULACIONAL Sabemos que as mdias se distribuem segundo uma distribuio normal com mdia e desvio-padro

quando estas mdias provm de uma distribuio

populacional normal ou quando o tamanho da amostra suficientemente grande. Quando retiramos uma amostra, a mdia X uma das muitas mdias possveis de se obter de uma populao. Assim, por exemplo, se adotarmos um nvel de confiana de 95%, poderemos dizer que 95% das mdias amostrais estaro dentro de 1,96 erros padro.

Sabendo que o intervalo de confiana tem centro na mdia amostral, determinado da seguinte maneira:

[X ] onde
graus de liberdade, sendo

=z

Quando n pequeno e desconhecido, usamos a distribuio t-student com n-1

= t.

s n
PARA MDIA COM VARINCIA

CASO 1: INTERVALO DE CONFIANA POPULACIONAL CONHECIDA.

Para uma varivel aleatria X normalmente distribuda, com mdia 2 desconhecida e varincia conhecida , uma amostra aleatria retirada e calcula-se X . O intervalo de confiana com nvel de confiana 1 dado por:

X Z .
2

X + Z .
2

= X Z . n 2 n
2

Exemplo: Uma mquina enche pacotes de caf com uma varincia igual a 100 g . Ela estava regulada para ench-los com 500g, em mdia. Agora ela se desregulou, e queremos saber qual a nova mdia . Uma amostra de 25 pacotes apresentou mdia igual a 485g. Estime a mdia por intervalo de 95% de confiana. R: [481,08; 488,92]

9
CASO 2: INTERVALO DE CONFIANA PARA MDIA DE UMA DISTRIBUIO 2 NORMAL COM VARINCIA DESCONHECIDA. Suponha que X seja uma varivel aleatria de uma distribuio normal com 2 mdia desconhecida e varincia desconhecida, retira-se um amostra aleatria e calcula-se a mdia amostral X e a varincia amostral Student tem-se:

s2 .

Utilizando a distribuio t-

s s s X t ,n1 . X + t ,n1 . = X t ,n1 . 2 2 2 n n n


OBS: Quando n for grande, podemos utilizar a distribuio normal. Exemplo: Um pesquisador est estudando a resistncia de um determinado material sob determinadas condies. Ele sabe que essa varivel normalmente distribuda. Foi retirado uma amostra de 9 unidades 4,9 ; 7,0 ; 8,1; 4,5 ; 5,6; 6,8 ; 7,2 ; 5,7; 6,2. a) Determine um intervalo de 90% de confiana para a resistncia mdia populacional. b) Determine um intervalo de 95% de confiana. para a resistncia mdia populacional. c) Verifique os resultados de a) e b), e conclua a respeito do erro de estimao e o nvel de confiana. R: a) [5,50; 6,94] b) [5,33; 7,11] c) Quanto maior o nvel de confiana maior o intervalo e menor a preciso CASO 3: ESTIMAO POR INTERVALO DE CONFIANA PARA A PROPORO

Para a estimativa pontual da proporo ( p ), utilizada a distribuio Binomial, onde p a razo entre o nmero de sucesso (itens que apresentam uma determinada caracterstica) e o nmero total da amostra (n). A estimativa intervalar da proporo populacional (), para grandes amostras, simtrica em relao proporo amostral, tal como ocorre com o intervalo para a mdia populacional em relao a mdia amostral. A principal diferena entre as estimativa de mdias e de propores est nos desvios padres das distribuies amostrais. O desvio padro se baseia na distribuio binomial e dada por:

p =

p.(1 p) n

Se n grande e p>=0,1, ento a aproximao Normal para Binomial pode ser usada, resultando:

p Z .
2

p.(1 p ) p.(1 p ) p.(1 p) p + Z . = p Z . 2 2 n n n

Exemplo: De 80 entrevistados, 48 acreditam que o dlar estar com o preo mais baixo daqui a um ms. Construa um intervalo de 95% de confiana para a verdadeira proporo de pessoas que acreditam que o dlar estar abaixo do valor atual.

R: [0,4926; 0,7074]

Vous aimerez peut-être aussi