Académique Documents
Professionnel Documents
Culture Documents
ESTUDOS POLITÉCNICOS
APONTAMENTOS DE
PROBABILIDADES E ESTATÍSTICA
JORGE T. RIBEIRO
2010
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
APONTAMENTOS DE
PROBABILIDADES E ESTATÍSTICA
ÍNDICE
Pág.
O QUE É A ESTATÍSTICA? .................................................................................................. 4
EVOLUÇÃO HISTÓRICA DA ESTATÍSTICA......................................................................... 5
I. INTRODUÇÃO À ESTATÍSTICA ...................................................................................... 11
I.1. ESTATÍSTICA ................................................................................................................ 11
I.1.1. Definições e generalidades................................................................................ 11
I.1.2. Estatística descritiva e estatística indutiva ......................................................... 11
I.1.3. Variáveis discretas e contínuas.......................................................................... 12
II. ESTATÍSTICA DESCRITIVA............................................................................................ 13
II.1. DISTRIBUIÇÕES DE FREQUÊNCIA ................................................................................ 13
II.1.1. Gráficos de linha e de barras ............................................................................ 13
II.1.2. Intervalos e limites de classe ............................................................................ 14
II.1.3. Histogramas e polígonos de frequência ............................................................ 15
II.1.4. Curvas de frequência........................................................................................ 16
II.2. MEDIDAS DE TENDÊNCIA CENTRAL E DE LOCALIZAÇÃO .............................................. 17
II.2.1. Média aritmética................................................................................................ 17
II.2.2. Mediana ............................................................................................................ 17
II.2.3. Moda................................................................................................................. 18
II.2.4. Relação entre média, mediana e moda............................................................. 19
II.2.5. Quantis: quartis, decis e percentis .................................................................... 19
II.2.6. Média geométrica ............................................................................................. 21
II.2.7. Média harmónica .............................................................................................. 21
II.3. MEDIDAS DE DISPERSÃO ............................................................................................ 22
II.3.1. Amplitude total .................................................................................................. 22
II.3.2. Amplitudes modificadas .................................................................................... 22
II.3.3. Desvio médio .................................................................................................... 22
II.3.4. Variância........................................................................................................... 23
II.3.5. Desvio padrão................................................................................................... 23
II.3.6. Coeficiente de variação..................................................................................... 23
II.4. ASSIMETRIA E KURTOSE ............................................................................................. 24
II.4.1. Coeficientes de assimetria ................................................................................ 24
II.4.2. Coeficientes de kurtose .................................................................................... 24
III. PROBABILIDADES E INFERÊNCIA ESTATÍSTICA ...................................................... 26
III.1. TEORIA DA PROBABILIDADE ....................................................................................... 26
III.1.1. Definições e conceitos básicos ........................................................................ 26
III.1.2. Acontecimentos mutuamente exclusivos e não exclusivos .............................. 27
III.1.3. Regras de adição............................................................................................. 28
III.1.4. Probabilidade condicional ................................................................................ 28
III.1.5. Acontecimentos independentes e dependentes............................................... 29
III.1.6. Análise combinatória........................................................................................ 30
III.1.6.1. Arranjos simples ................................................................................ 30
III.1.6.2. Arranjos completos............................................................................ 31
III.1.6.3. Permutações simples ........................................................................ 31
III.1.6.4. Permutações completas .................................................................... 31
III.1.6.5. Permutações circulares ..................................................................... 31
2
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
3
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
O QUE É A ESTATÍSTICA?
É frequente ouvir-se falar na palavra Estatística. Os noticiários, os jornais, as campanhas eleitorais, os desportos,
etc. mencionam, vezes sem conta, a palavra Estatística. Mas, o que será a Estatística?
A palavra Estatística tem a sua origem no latim – status – designação esta que significa Estado, no sentido político
do termo. Segundo diversos autores, o termo Estatística foi usado pela primeira vez em 1589 pelo historiador
italiano Girolami Ghilini num estudo – “civile, politica, statistica e militare scienza”.
Porém, na sua concepção actual, a Estatística é um instrumento de leitura da informação, e sua transformação em
Conhecimento, ocupando-se ainda de estratégias e decisão num contexto de variabilidade e incerteza.
Pode-se assim dizer que
A obtenção de dados é uma das tarefas mais delicadas e complexas da Estatística. Os dados são obtidos
recorrendo a técnicas de amostragem e ao planeamento de experiências.
A Amostragem é fundamental em estudos observacionais.
4
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
O outro ramo da Estatística – a INFERÊNCIA ESTATÍSTICA (ou ESTATÍSTICA INDUTIVA) – que tem por base a Teoria das
Probabilidades, permite induzir do que se verifica numa amostra para a população de que esta foi extraída, i.e.
tomar decisões sobre hipóteses, estimar parâmetros populacionais a partir das características amostrais
relevantes, comparar populações, relacionar uma variável resposta com variáveis controladas, etc., constituindo um
instrumento de previsão da evolução futura de um fenómeno em estudo.
Sintetizando, pode-se dizer que a Estatística se subdivide em dois grandes ramos complementares:
Nessas antigas civilizações encontra-se também a ideia de arrolamento de recursos, indispensável à organização
da sociedade.
A Estatística começou pois por ser descritiva, como quase todas as disciplinas científicas. Era considerada, até ao
século XVIII, a ciência do Estado, dado que o apoio estatístico era fundamental para a sua organização
administrativa. Embora hoje em dia esse apoio ainda seja indispensável, a Estatística no sentido moderno, alargou
horizontes e é muito mais que a ciência do Estado, como veremos adiante.
5
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
A partir da segunda metade do século XVII, quando começou a surgir um tratamento mais elaborado de dados
demográficos e económicos, a Estatística começa a evoluir para a ciência que conhecemos actualmente. Surgiram
nessa altura duas importantes Escolas, uma no Reino Unido e outra na Alemanha. A Escola Alemã, cujo
representante mais notável foi Gottfried Achenwall (1719-1772), afastou-se das ideias que fundamentam a
Estatística moderna ao se debruçar apenas sobre o método utilizado nos estudos dedicados à descrição dos
estados políticos. A Escola Inglesa, por outro lado, preocupou-se com o estudo numérico dos fenómenos sociais e
políticos. A obra publicada em 1662 por John Graunt (1620-1674), é um estudo analítico sobre factos demográficos,
apresentando registos sobre nascimentos, casamentos, mortes, chegando mesmo a obter diversas conclusões
sobre a periodicidade dos caracteres registados, e constitui um marco no início da Estatística moderna. Outro
membro da Escola Inglesa, Sir William Petty (1623-1687) que trabalhou com John Graunt, apresentou pela primeira
vez estudos estatísticos baseados em tabelas e números relativos, e pode, também ele, ser considerado um
impulsionador da Estatística moderna.
Deste modo, nos finais do século XVIII e ao longo do século XIX o sucesso de raciocínios apoiados no tratamento
de dados deu um novo impulso à Estatística, nomeadamente na Alemanha e no Reino Unido.
No entanto, a afirmação da Estatística como ciência deve muito a Adolphe Quetelet (1796-1874), um estatístico
belga que desenvolveu não só a Estatística Descritiva como a sua aplicação em ciências sociais, pugnou pela
normalização na aquisição e registo dos dados, e nomeadamente pela normalização das estatísticas oficiais, por
forma a possibilitar uma gestão eficaz da informação.
Foi este belga que organizou em Bruxelas, em 1853, uma reunião internacional de estatísticos, que está na origem
do International Statistical Institute, a mais antiga organização científica não governamental do Mundo.
6
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
Sir Francis Galton (1822-1911), influenciado pelo trabalho de A. Quetelet, iniciou a utilização sistemática da
Estatística como instrumento de aquisição de Conhecimento, não sendo decerto injusto considerá-lo também um
grande impulsionador do desenvolvimento desta nova ciência.
Porém, é Karl Pearson (1894-1936) que projecta definitivamente a Estatística, introduzindo-lhe uma base científica,
apresentando comparações entre amostras reais e teóricas.
Student (pseudónimo usado por William Gosset (1876-1937)) e Sir Ronald Fisher (1890-1962), contemporâneos de
Karl Pearson, revolucionaram a tal ponto a metodologia estatística no primeiro quartel do século XX, que a tornaram
um dos instrumentos indispensáveis na aquisição de conhecimento científico em todas as áreas. Student em 1908
usou, por um lado, uma abordagem matemática sofisticada e, por outro lado, antecipou as modernas técnicas de
simulação. A abordagem de R. Fisher em 1925 mudou o paradigma da Estatística, que passou a ser sobretudo
entendida como a ciência que nos guia na “produção” dos dados que importa analisar, mais do que a ciência de
analisar os dados recolhidos, por vezes pouco informativos ou mesmo totalmente inadequados.
7
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
Até finais do século XIX a Estatística parecia ancorada nos dados. É no início do século XX que pouco a pouco se
vai impondo a importância dos modelos.
No início do século XX o grande problema consistia no tratamento de pequenas amostras, a recolha da informação
relevante.
Contudo, o paradigma da Estatística continua a mudar. Se depois da revolução iniciada por R. Fisher podemos
considerar que a Estatística, mais do que a ciência de analisar os dados, passou a ser a ciência que estrutura a
forma de adquirir os dados que importa analisar, em que os estudos experimentais têm precedência sobre os
estudos observacionais, a evolução não parou aí. A importância crescente da sua matematização levou a grandes
desenvolvimentos da Teoria das Probabilidades, que é o ramo da Matemática que delimita a incerteza.
Com a aquisição de dados em larga escala, e a verdadeira mania de os coleccionar, os fins do século XX viram-se
defrontados com o problema contrário: como “escolher o minério entre tanta ganga”, i.e. como escolher em bases
de dados gigantescas os dados relevantes? A nova disciplina de Data Mining aborda este novo e importante
desafio da Estatística no futuro próximo.
Em Portugal, à semelhança de outros países europeus, a aplicação da Estatística surge com a necessidade do
Estado conhecer melhor as características da sua população, principalmente em termos militares. São conhecidos
dois importantes trabalhos estatísticos efectuados durante a Idade Média, designadamente:
• Rol de Besteiros do Conto (1260-1279), de D. Afonso III (1210-1279);
• Rol de Besteiros do Conto (1421-1422), de D. João I (1357-1433).
8
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
No século XVIII, Solano Constâncio (1777-1846) recorreu em inúmeras ocasiões a estatísticas sobre Portugal. No
século XIX, Santos Cruz (1841) publica um estudo sobre prostituição, tornando vulgar o hábito de registar dados.
Em 1864 realizou-se o I Recenseamento Geral da população portuguesa, o qual foi o primeiro a reger-se pelas
orientações internacionais do encontro de estatísticos de Bruxelas em 1853, marcando o início dos
recenseamentos da época moderna.
Embora estas orientações já indicassem que os recenseamentos deveriam ser realizados de 10 em 10 anos o
censo seguinte apenas se realizou em 1878, ao qual se seguiria o Censo de 1890. A partir de então os
recenseamentos da população têm vindo a realizar-se, com algumas excepções, regularmente em intervalos de 10
anos. O último recenseamento da população em Portugal realizou-se em 2001.
Outro marco importante na história dos censos ocorreu em 1970, quando em simultâneo com o Recenseamento da
População se realizou o I Recenseamento da Habitação.
Em face da grande importância que a Estatística tem para os Estados, foram criados organismos centralizadores de
toda a actividade estatística oficial, tendo sido fundado em 1935 o Instituto Nacional de Estatística (INE), organismo
que superintende a Estatística em Portugal.
9
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
No que diz respeito ao ensino da Estatística nas universidades portuguesas, foi nas áreas de Economia que surgiu
primeiro, na década de 30 do século XX, ainda ligado ao paradigma da Estatística como ciência descritiva.
O desenvolvimento proporcionado pela matematização da Estatística e do seu ensino em Portugal deve-se a Diogo
Pacheco d’Amorim.
A primeira exposição moderna de um curso de Probabilidades e Estatística é realizada por Dias Agudo em 1961.
J. Tiago de Oliveira teve um papel fundamental no reconhecimento da Estatística como área independente. Bento
Murteira merece também ser destacado, sobretudo pelo facto dos seus livros catalizarem a formação de uma
escola de Estatística em Portugal.
Mais recentemente, o ensino da Estatística foi introduzido também nos programas do ensino secundário.
10
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
I. INTRODUÇÃO À ESTATÍSTICA
I.1. ESTATÍSTICA
I.1.1. Definições e generalidades
APLICAÇÕES:
11
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
CARACTERÍSTICAS VARIÁVEIS
Escala NOMINAL: os dados são identificados por um nome que designa uma
classe, sendo as classes:
− Mutuamente exclusivas;
− Exaustivas
− Não ordenáveis.
12
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
Exemplo: Numa amostra constituída por 120 edifícios, constatou-se que 100 estavam em bom
estado de conservação, 15 necessitavam de obras de recuperação e 5 eram para demolir.
80
120 100.0
60
Diagrama Circular
40
20
0
4%
13% Bom estado de A necessitar de A demolir
Bom estado de conservação conservação recuperação
A necessitar de recuperação 90
80
A demolir 70
Ferq. Relativas (%)
83%
60
50
40
30
360 ⋅ f 20
A= em que: 10
N
0
A – ângulo;
Bom estado de A necessitar de A demolir
f – frequência; conservação recuperação
N – número de dados
13
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
Nk Nk
fr = ou f r (%) = ×100
N N
DADOS QUANTITATIVOS
TABELA DE FREQUÊNCIAS
Intervalo da classe
14
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
100 60
90
50
80
40
60
50 30
40
20
30
20
10
10
0 0
495-497 497-499 499-501 501-503 503-505 505-507 507-509 495-497 497-499 499-501 501-503 503-505 505-507 507-509
120
Freq. Relativas Acumuladas (%)
100
80
60
40
20
0
495 497 499 501 503 505 507 509
Peso (g)
15
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
bimodal multimodal
16
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
População ( µ ) ou Amostra ( x )
Dados agrupados
k
f Ai ⋅ pmi
f A1 ⋅ pm1 + f A2 ⋅ pm2 + + f Ak ⋅ pmk f A ⋅ pm f A ⋅ pm
x= = i =1
= =
f A1 + f A2 + + f Ak k
fA N
f Ai
i =1
ou
k
x = f r1 ⋅ pm1 + f r2 ⋅ pm2 + + f rk ⋅ pmk = f ri ⋅ pmi = f r ⋅ pm
i =1
II.2.2. Mediana
A Mediana de um conjunto de dados, organizados por ordem crescente ou decrescente de
grandeza, é o valor central ou a média aritmética dos dois valores centrais, consoante o
número de dados é ímpar ou par, respectivamente.
Quer para o caso de dados agrupados, quer para o caso de dados não agrupados, a posição
da mediana é dada por:
χ N 1
+
2 2
17
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
N
− f AaA
M = Linf + c⋅ 2
f AM
em que:
II.2.3. Moda
A moda é o valor que ocorre com maior frequência. A moda pode não existir, e se existir pode
não ser única.
d1
Mod = Linf + c ⋅
d1 + d 2
em que:
18
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
1º Quartil, Q1 Posição: χ N 1
+
4 2
2º Quartil, Q2 ≡ M Posição: χ 2⋅ N 1
+
4 2
3º Quartil, Q3 Posição: χ 3⋅ N 1
+
4 2
Decis dividem os dados ordenados em dez partes iguais, existindo portanto 9 decis.
D1 ; D2 ; D3 ; ... ; D9.
Percentis dividem os dados ordenados em cem partes iguais, existindo portanto 99 percentis.
P1 ; P2 ; P3 ; ... ; P99.
sendo o P25 coincidente com o Q1, o P50 coincidente com o Q2 e por conseguinte com a
Mediana, e o P75 coincidente com o Q3; ou seja:
19
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
3⋅ N
− f AaA
Q3 = Linf + c ⋅ 4
f AQ3
em que:
7⋅ N
− f AaA
D7 = Linf + c ⋅ 10
f AD7
em que:
83 ⋅ N
− f AaA
P83 = Linf + c ⋅ 100
f AP83
em que:
20
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
⋅ x N = ( x1 ⋅ x2 ⋅ x3 ⋅ ⋅ xN )
1
MG = N x1 ⋅ x2 ⋅ x3 ⋅ N
21
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
R90 = P95 − P5
Na situação dos dados não estarem agrupados em classes, tem-se a expressão seguinte:
x−x
DM =
N
(f ⋅ pm − x )
DM =
A
ou DM = (f r ⋅ pm − x )
N
22
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
II.3.4. Variância
População ( σ 2 ) ou Amostra ( s 2 )
Na situação dos dados não estarem agrupados em classes, tem-se a expressão seguinte:
(x − x )2 x2 − N ⋅ x 2
s2 = =
N −1 N −1
s =
2
[f A ⋅ ( pm − x )
2
]
N −1
População ( σ ) ou Amostra ( s )
Na situação dos dados não estarem agrupados em classes, tem-se a expressão seguinte:
(x − x )2
s=
N −1
s=
[f A ⋅ ( pm − x )
2
]
N −1
s
v=
x
23
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
3 ⋅ (x − M )
A=
s
Coeficiente de Assimetria:
N
N⋅ (xi − x )3
A= i =1
(N − 1) ⋅ (N − 2) ⋅ s 3
24
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
Na amostra da distribuição 1 (Kurtose mais elevada) existe uma maior concentração de dados
no centro e nas caudas, e menor concentração nos intervalos que separam aquelas zonas.
Coeficiente de Kurtose:
N
N ⋅ ( N + 1) ⋅ (xi − x )4
k= i =1
− 3⋅
(N − 1)2
(N − 1) ⋅ (N − 2) ⋅ (N − 3) ⋅ s 4 ( N − 2 ) ⋅ ( N − 3)
ou
Q3 − Q1
k=
2 ⋅ (P90 − P10 )
25
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
Abordagem CLÁSSICA:
h
p = P (E ) =
N
N −h h
q = P (~ E ) = = 1 − = 1 − P (E ) = 1 − p ,
N N
logo, p + q =1
0 ≤ P (E ) ≤ 1
26
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
Exemplo:
Probabilidade de um português com 18 anos viver pelo menos até aos 70 anos?
Abordagem SUBJECTIVA:
Apropriada quando existe apenas uma única oportunidade para o acontecimento ocorrer, e ele
ocorrerá ou não naquela única vez. A probabilidade é então o grau de credibilidade que cada
indivíduo atribui à ocorrência do acontecimento, baseado em todos os factos e dados
disponíveis.
Exemplo:
Probabilidade do actual Governo se manter inalterado nos próximos 6 meses?
♦♦♦
Experiência Aleatória: Uma situação em relação à qual estejam associados, de forma não
controlada, dois ou mais resultados possíveis.
Exemplos:
Lançamento de moeda; atraso de combóio
Exemplos:
{E ; c} ; [0 ; + ∞[
Acontecimento: Conjunto de elementos de um espaço amostral, ou seja um sub-conjunto do
espaço amostral.
Exemplo:
Ás e Rei relativamente a uma carta retirada de um baralho.
Exemplo:
Ás e Espadas relativamente a uma carta retirada de um baralho.
27
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
A B A A∩B
B
Universo, U Universo, U
P( A ou B ) = P( A B ) = P( A) + P(B ) P( A ou B ) = P( A B ) = P( A) + P(B ) − P( A B )
P( A e B )
P( A | B ) = com P (B ) > 0
P (B )
A A∩ B B A∩ B B
Universo, U
P( A B )
P( A | B ) = ⇔ P ( A B ) = P ( A | B ) ⋅ P (B )
P (B )
28
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
Exemplo:
Três lâmpadas defeituosas foram inadvertidamente misturadas com 6 lâmpadas boas.
Escolhidas 2 lâmpadas ao acaso, calcular a probabilidade de serem ambas boas. Imagine-se
que as lâmpadas são retiradas uma após a outra e considerem-se os acontecimentos
seguintes:
A: a 1ª lâmpada é boa;
B: a 2ª lâmpada é boa.
portanto
P( A ∩ B ) = P( A) ⋅ P(B ) com P( A) ≥ 0 e P(B ) ≥ 0
Exemplos:
1. Lançamento sucessivo de 2 dados.
Considerar os seguintes acontecimentos:
A: a pontuação total é ímpar;
B: o resultado obtido no primeiro dado é 6;
C: a pontuação total é 7.
Verifique se os acontecimentos são independentes.
1º 2º
1/2 C CC ½ ½ = 0.25
1/2
C
1/2 O CO ½ ½ = 0.25
1/2 C OC ½ ½ = 0.25
1/2
O
1/2
O OO ½ ½ = 0.25
1.00
29
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
Exemplos:
1. Acontecimentos mutuamente exclusivos são dependentes?
1º 2º
8/10
B1
2/9 D2 B1D2 8/10 x 2/9 = 16/90
1.00
P( A ∩ B ) = P( A) ⋅ P(B | A) ou P( A ∩ B ) = P(B ) ⋅ P( A | B )
n!
n
Ar = = n ⋅ (n − 1) ⋅ (n − 2 ) ⋅ ⋅ (n − k + 1)
(n − r )!
Exemplo:
Quantos números de quatro algarismos distintos existem?
30
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
n
Ar′ = n r
Exemplo:
Quantos números de quatro algarismos existem?
Agrupamentos formados por n elementos distintos, diferindo uns dos outros pela ordem em
que tais elementos estão dispostos. Supõe-se ainda que não é permitida a repetição de
elementos nos agrupamentos. Trata-se de um caso particular dos Arranjos Simples de n
elementos, tomados n a n.
Pn = n!= n ⋅ (n − 1) ⋅ (n − 2 ) ⋅ ⋅ 3 ⋅ 2 ⋅1
Exemplo:
De quantos modos distintos podem ser colocados, numa estante, cinco livros diferentes?
Agrupamentos formados por n elementos distintos, não sendo necessário utilizar todos os
elementos do conjunto universo, diferindo uns dos outros pela natureza e/ou pela ordem dos
elementos escolhidos.
π n = nn
Exemplo:
Quantos são os números de cinco algarismos que se podem escrever apenas com os
algarismos ímpares?
Agrupamentos formados por n elementos em círculo, diferindo uns dos outros pela natureza
e/ou pela ordem dos elementos escolhidos.
C n = (n − 1)!
Exemplo:
De quantas maneiras distintas se podem sentar 5 pessoas em torno de uma mesa?
31
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
Agrupamentos de n elementos, dos quais n1 são iguais, n2 são iguais, ... nr são iguais.
n!
Pn′ =
n1 ! ⋅ n2 ! ⋅ ⋅ nr !
Exemplo:
Quantas palavras diferentes se podem formar com as letras A, Y, D, D e D?
n n!
= nC r =
r (n − r )! ⋅ r !
Exemplo:
De um grupo de 30 pessoas, pretende-se formar uma comissão com 8 membros, sem tarefas
definidas. De quantas maneiras distintas é possível fazê-lo?
n
K r = n + r −1C r
Exemplo:
Num gabinete de uma empresa trabalham 10 pessoas. O director da empresa tem 6 trabalhos
iguais para serem executados, podendo atribuir mais do que um trabalho a cada um dos
funcionários. De quantas maneiras pode o director escolher os funcionários que irão realizar os
trabalhos?
32
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
E(X ) = [X ⋅ P( X )]
Variância de V.A. Discretas: Calcula-se em relação a E ( X )
VAR( X ) = [[x − E ( X )] ⋅ P( X )]
2
VAR( X ) = [X 2
⋅ P( X ) − [ [X ⋅ P( X )]] ] = E (X ) − [E ( X )]
2 2 2
APLICAÇÃO:
V.A. discretas;
Processo de Amostragem do tipo do de Bernoulli.
É NECESSÁRIO:
Número de sucessos, x;
Número de tentativas, ou observações, n;
Probabilidade de sucesso, p.
33
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
Cada par ( p ; n ) caracteriza uma única distribuição ou um único espaço amostral. Para
qualquer dimensão amostral n, a distribuição Binomial será sempre simétrica se p = 0.50 ; será
assimétrica positiva se p < 0.50 e assimétrica negativa se p > 0.50 , conforme se vê no
exemplo da figura seguinte:
n!
P ( X = x )= nC x ⋅ p x ⋅ (1 − p )
(n − x )
= ⋅ p x ⋅ q (n − x )
x ! ⋅ (n − x )!
E(X ) = n ⋅ p VAR( X ) = n ⋅ p ⋅ (1 − p ) = n ⋅ p ⋅ q
N − XT
Cn − x ⋅ X T C x
P( X = x ; N , X T , n ) = N
Cn
em que:
x – número dado de sucessos;
N – número total de itens da população;
XT – número total de “sucessos” na população;
n – número de itens da amostra
XT XT N − XT N − n
E(X ) = n ⋅ VAR ( X ) = n ⋅ ⋅ ⋅
N N N N −1
34
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
CONDIÇÕES DE APLICAÇÃO:
λx ⋅ e − λ
P( X = x ; λ ) =
x!
em que:
E(X ) = λ VAR( X ) = λ
35
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
A área entre 2 quaisquer pontos, abaixo da curva, dá-nos a probabilidade da V.A. contínua
assumir um valor entre esses 2 pontos.
Exemplo:
f(X)
ou seja,
8000
f ( X ) ⋅ dX
6000
36
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
f(X)
+∞
f ( X ) ⋅ dX
−∞
2 ⋅π ⋅σ
em que:
µ - média da distribuição;
σ - desvio padrão da distribuição.
E(X ) = µ VAR ( X ) = σ 2
37
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
µ =0 σ =1
X −µ
Z=
σ
As áreas sob a curva de qualquer distribuição Normal podem ser obtidas utilizando-se uma
tabela Normal padronizada (Tabelas Estatísticas, 1995), após a conversão, referida acima, da
escala original para a escala em termos de desvios padrões.
N µ = n⋅ p e σ = n⋅ p⋅q
N µ =λ e σ = λ
38
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
Exemplo:
A distância até encontrar o primeiro defeito, é o mesmo que considerar que no intervalo [0 ; X ]
não se encontra nenhum defeito.
P( X > x ) = e − λ ⋅x
P( X ≤ x ) = 1 − e − λ ⋅x
1 1
E(X ) = VAR( X ) =
λ λ2
39
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
Estimador não tendencioso: é uma estatística amostral cujo valor esperado é igual ao
parâmetro que está a ser estimado. Portanto um valor
esperado é a média de longo prazo da estatística da amostra.
Se uma estatística amostral vai ser usada para estimar o valor específico de um parâmetro
(como estimador pontual), deve tal estatística basear-se numa amostra aleatória extraída da
população.
AMOSTRA ALEATÓRIA: é extraída por um procedimento tal que cada elemento da população
tenha uma probabilidade igual e conhecida de ser escolhido e que
não tenha nenhuma fonte de erro sistemático. Obtidas por várias
técnicas específicas de amostragem, como é o caso das Tabelas de
Números Aleatórios.
40
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
Para qualquer tamanho dado, n, de amostra tomada de uma população com média, µ, o valor
da média da amostra, X , irá variar de amostra para amostra. Esta variabilidade serve como
base da distribuição de amostragem, descrita por:
( ) ( )
Valor esperado E X , ou média E X = µ ;
σ
Desvio Padrão da distribuição das médias σ X (erro padrão da média) σ X =
n
σ N −n
Para amostras de uma população finita: σ X = ⋅ , não se aplicando
n N −1
esta correcção se n < 0.05 ⋅ N
Se o desvio padrão da população for desconhecido, então o erro padrão da média pode ser
estimado, usando-se o desvio padrão da amostra como estimador do desvio padrão da
população.
s
sX = ,
n
s N −n
e quando a população é finita, este estimador toma a forma s X = ⋅
n N −1
41
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
CONDIÇÕES DE UTILIZAÇÃO:
n ≥ 30 ou
n < 30 ; população normalmente distribuída e σ conhecido.
Quando está garantido o uso da distribuição Normal, o intervalo de confiança para a média é
dado por:
X ± z ⋅ σ X ou X ± z ⋅ s X
2
z ⋅σ
n= baseado na distribuição Normal,
E
em que:
42
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
X −µ
z= ,
sX
incluindo no denominador uma variável diferente para cada média de amostra, gerando valores
de z que se distribuem de acordo com as distribuições t-Student (Tabelas Estatísticas, 1995),
sendo cada uma delas particularizada pelos graus de liberdade envolvidos.
X ± t g .l . ⋅ s X
43
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
HIPÓTESES A FORMULAR:
H 0 - hipótese nula, sugere que a afirmação é verdadeira;
H1 - hipótese alternativa, sugere que a afirmação é falsa.
44
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
Usa-se um teste bilateral quando interessa saber possíveis desvios em ambas as direcções do
α
valor hipotético da média, sendo a área em cada cauda de .
2
µ0 ± z ⋅σ X µ0 ± z ⋅ s X
Quando o valor da média da amostra for determinado, ele será transformado para um valor z:
X − µ0 X − µ0
z= z=
σX sX
Usa-se um teste unilateral quando interessa saber possíveis desvios em apenas uma direcção,
a partir do valor hipotético da média.
Tipo de teste
Nível de Significância
Unilateral Bilateral
5% + 1.65 (ou – 1.65) ± 1.96
1% + 2.33 (ou – 2.33) ± 2.58
45
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
ERRO TIPO II: ocorre quando há aceitação de H 0 , sendo esta falsa. A probabilidade
deste tipo de erro (β ) ocorrer só pode ser determinada relativamente a
um valor específico, incluído no intervalo da H 1 . O procedimento para
obter essa probabilidade contempla os passos seguintes:
46
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
Estados Possíveis
Decisões Possíveis
H 0 Verdadeira H 0 Falsa
Aceita-se H 0 Aceita-se correctamente Erro Tipo II
Rejeita-se H 0 Erro Tipo I Rejeita-se correctamente
n=
( z0 − z1 ) ⋅ σ 2
2
(µ1 − µ 0 )2
em que:
X − µ0
t=
sX
47
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
DISTRIBUIÇÃO χ
2
Para uma população de valores normalmente distribuídos, pode-se mostrar que o quociente
(n − 1) ⋅ s 2 segue uma distribuição de probabilidade χ2 (Robalo, 1995), existindo distribuições
σ 2
χ2 =
(n − 1) ⋅ s 2
σ 02
As distribuições χ , embora contínuas, não são simétricas, devendo-se dar particular atenção
2
χ =
2 ( f O − f E )2 com k − m − 1 graus de liberdade, sendo:
fE
48
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
CORRECÇÃO DE CONTINUIDADE:
χ =
2 O
com k − m − 1 graus de liberdade e com diferenças entre as frequências
fE
maiores que 0.5.
r k
fO i ⋅ fO j
i =1 j =1
f E ij =
n
sendo:
r – número de linhas;
k – número de colunas
χ2 =
( f O − f E )2 com (r − 1) ⋅ (k − 1) graus de liberdade.
fE
49
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
HIPÓTESES:
.. .. .
.. ..
Y Y Y
..
......
. . ..
. ..... . .
X X X
relação linear directa relação linear inversa não há relação
... ... .
... .. . .
.. . . .....
.
... .. ... ...... .. . .....
Y Y Y
. .
. .. ...
. .. ... .. ... ..
. . .
.. .. .. . .. . ... . ... .
X X X
relação curvilínea relação linear directa, relação linear directa,
directa baixo grau de relação alto grau de relação
50
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
Se o diagrama de dispersão revelar uma relação que é de modo geral linear, então constrói-se
uma linha que seja a recta que melhor se ajusta aos dados. A construção e localização dessa
recta é determinada pelo MÉTODO DOS MÍNIMOS QUADRADOS.
Yˆ = b ⋅ X + a
Pelo critério dos Mínimos Quadrados, a equação de regressão que melhor se ajusta aos dados
é aquela para a qual é mínima a soma dos quadrados dos desvios entre os valores observados
(pontos do diagrama de dispersão) e estimados para a variável dependente (obtidos pela
equação de recta) a partir dos dados amostrais.
(X ⋅Y ) − n ⋅ X ⋅Y
b= a = Y −b⋅ X
(X ) − n ⋅ X
2 2
A equação da recta assim obtida tem a propriedade de passar sempre pelo ponto X ; Y . ( )
sY , X =
(Y − Y ) 2
ou sY , X =
(Y ) − a ⋅
2
Y −b⋅ (X ⋅Y )
n−2 n−2
O Erro Padrão de Estimação pode ser usado para estabelecer um intervalo de previsão para a
variável dependente, para um dado valor específico da variável independente. A utilização de
sY , X para este propósito baseia-se nas seguintes hipóteses sobre a população:
Se n ≥ 30 Yˆ ± z ⋅ sY , X
51
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
HIPÓTESES:
σ Y2, X sY2 , X
População : ρ = 1− 2
2
Amostra : r = 1−
2
σY sY2
a⋅ Y +b⋅ (X ⋅Y ) − n ⋅Y 2
r =
2
(Y ) − n ⋅ Y
2 2
Assim, como este coeficiente varia entre 0 e 1, obtém-se a percentagem de variação numa
variável que é “explicada” estatisticamente pela variação na outra variável. Inversamente,
1 − r 2 , é a percentagem que não se pode explicar pelo relacionamento entre as duas variáveis,
devendo ser considerada como devida a outros factores não incluídos no estudo.
52
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
COEFICIENTE DE CORRELAÇÃO, ρ:
População : ρ = ρ2 Amostra : r = r2
n⋅ (X ⋅Y ) − X⋅ Y
r=
n⋅ (X ) − (
2
X ) ⋅ n⋅
2
(Y ) − (
2
Y)
2
Y
.....
..
Y Y
...
..
....
...
. ... .... ....... .
.....
...
X X X
r=+1 r2 = 1 r=0 r2 = 0 r=–1 r2 = 1
. . ... . .
Y
.. .
... .. ... ...... .. .
Y
.........
.........
. ... . ... .
..
X X
O valor do coeficiente de correlação amostral pode ser utilizado como estimativa do verdadeiro
coeficiente de correlação, ρ, da população. Contudo, é mais conveniente expressar o
coeficiente amostral conjuntamente com um intervalo de confiança para o verdadeiro valor.
53
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
54
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
IV.1. Introdução
Os Números-Índice são um importante instrumento para sintetizar modificações em variáveis
económicas durante um determinado período de tempo.
em que:
ÍNDICES DE LASPEYRE:
( pn ⋅ q0 ) ( p0 ⋅ qn ) ( pn ⋅ qn )
IPL = ⋅100 IQL = ⋅100 IVL = ⋅100
( p0 ⋅ q0 ) ( p0 ⋅ q0 ) ( p0 ⋅ q0 )
55
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
ÍNDICES DE PAASCHE:
( pn ⋅ qn ) ( pn ⋅ q n ) ( pn ⋅ qn )
IPP = ⋅100 IQP = ⋅100 IVP = ⋅100
( p0 ⋅ qn ) ( pn ⋅ q0 ) ( p0 ⋅ q0 )
ÍNDICES DE FISHER:
I n (antigo )
I n (alterado ) = ⋅100
índice antigo na nova base
Uma das aplicações é o poder aquisitivo da unidade monetária, dado pelo inverso do IPC:
1
poder aquisitivo = ×100 .
IPC
salário líquido
ren dim ento real =
IPC
56
Apontamentos de
PROBABILIDADES e ESTATÍSTICA
V. BIBLIOGRAFIA RECOMENDADA
Os livros principais estão indicados com •
− D’Hainaut, L. – Conceitos e métodos da estatística – uma variável a uma dimensão. Vol. I.
2ª Edição. Fundação Calouste Gulbenkian, Lisboa, 1997;
• Guimarães, Rui C.; Cabral, José S. – Estatística. McGraw Hill, Lisboa, 1998;
− Hoaglin, David C.; Mosteller, Frederick; Tuckey, John W. – Análise Exploratória de Dados.
Técnicas robustas. Um guia. Estatística 1. Edições Salamandra, 1992;
− Meyer, Paul L. – Probabilidade. Aplicações à estatística. Livros Técnicos e Científicos
Editora. 1991;
− Mood, Alexander M.; Graybill, Franklin A.; Boes, Duane C. – Introduction to the theory of
statistics. McGraw Hill International Editions;
• Murteira, Bento J.F. – Probabilidades e Estatística. Vol. 1. 2ª ed. McGraw Hill, Lisboa, 1992;
• Murteira, Bento J.F. – Probabilidades e Estatística. Vol. 2. 2ª ed. McGraw Hill, Lisboa, 1992;
• Murteira, Bento J.F. – Análise Exploratória de Dados. Estatística Descritiva. McGraw Hill,
Lisboa, 1993;
• Pestana, Dinis Duarte; Velosa, Sílvio Filipe – Introdução à Probabilidade e Estatística. Vol.1.
Fundação Calouste Gulbenkian. Lisboa, 2002.
• Robalo, A. – Tabelas Estatísticas. Edições Sílabo. Lisboa, 1995;
− Stevenson, William J. – Estatística aplicada à administração. Editora Harbra, 1986;
− Kazmier, Leonard J. – Estatística Aplicada à Economia e Administração. McGraw Hill,
1982.
57