Vous êtes sur la page 1sur 4

4. DISTRIBUIO TERICA DE PROBABILIDADES (Wilks, cap.

4)
4.1 Introduo.
Como discute Wilks (1995) distribuies de probabilidade so abstraes. Ou seja, representam os dados apenas aproximadamente,
embora em muitos casos a aproximao pode ser muito boa. Basicamente, existem 3 jeitos nos quais o emprego de distribuies de
probabilidade pode ser til:
i)
ii)

Compactao: quando tratamos com conjuntos de dados grandes. Uma distribuio de probabilidades terica que se
ajuste bem aos seus dados reduz o nmero de quantidades requeridas para caracterizar propriedades dos dados, uma
vez que podemos usar alguns poucos parmetros da distribuio.
Alisamento e interpolao: dados reais esto sujeitos a variaes amostrais que levam a regies sem dados (vazios ou
buracos no conjunto de dados) nas distribuies empricas. Por exemplo, podemos considerar a distribuio de
freqncia da precipitao diria obtida por satlite (mdia de 5 dias) para o ponto de grade 15.0S e 47.5W.
Precipitacao diaria em 15.0S e 47.5W
70

Frequencia Relativa (%)

60
50
40
30
20
10

38.5

More

36.5

34.5

32.5

30.5

28.5

26.5

24.5

22.5

20.5

18.5

16.5

14.5

12.5

8.5

10.5

6.5

4.5

2.5

Precipitacao(mm/dia)

Note que no existe nenhum valor observado entre 26.5mm/dia e 28.5mm/dia, embora certamente valores de precipitao podem
certamente ocorrer nesse ponto no espao. A imposio de uma distribuio terica nestes dados representaria a possibilidade
destas temperaturas ocorrerem, bem como permitiria a estimativa de sua probabilidade de ocorrncia.
iii)

Extrapolao: Estimar probabilidades para eventos fora do intervalo de um conjunto de dados particular requer
suposies sobre um comportamento ainda no observado.

4.2. O que uma distribuio Terica?


Uma distribuio terica uma forma matemtica abstrata, ou formato caracterstico. Algumas destas formas matemticas aparecem
naturalmente como uma conseqncia de certas espcies de processos que geram os dados, e quando aplicveis, estes so
especialmente candidatos plausveis para representar concisamente variaes em um conjunto de dados. Mesmo quando no existe
nenhuma base natural forte por trs da escolha de uma distribuio terica particular, pode-se encontrar empiricamente que a
distribuio representa um conjunto de dados muito bem.
A natureza especfica de uma distribuio terica determinada por valores particulares para entidades chamadas parmetros da
distribuio. Distribuies tericas so tambm chamadas distribuies paramtricas, porque seus atributos especficos dependem
dos valores numricos de seus parmetros. Por exemplo, uma distribuio normal ou Gaussiana tem como caracterstica o formato
de sino. Contudo, dizer-se que a temperatura mdia de Janeiro em uma certa localidade est bem representada por uma
distribuio Gaussiana no muito informativo sobre a natureza do dado, sem especificar QUAL distribuio Gaussiana representa
os dados. Existe, de fato, uma infinidade de exemplos particulares de distribuies Gaussianas correspondendo a todos possveis
valores dos dois parmetros que a definem, e . Mas sabendo-se por exemplo, que as temperaturas mensais para Janeiro esto
bem representadas por uma distribuio Gaussiana com = 23.0 oC e =2.5C permite conhecer, na realidade, uma grande
quantidade de informaes a respeito da natureza e magnitudes das variaes da temperatura de Janeiro em uma dada localidade.
4.2. Parmetros versus estatsticas.
Existe um potencial para confuso entre os parmetros de uma distribuio e as estatsticas da amostra. Parmetros de uma
distribuio so caractersticas abstratas de distribuies tericas particulares. Sucintamente, estes representam propriedades
subentendidas da populao. Em contraste, uma estatstica qualquer quantidade calculada a partir de uma amostra de dados. A
confuso entre elas cresce porque, para alguns distribuies tericas comuns, certas propriedades amostrais so bons estimadores
para os parmetros da distribuio. Por exemplo, o desvio-padro amostral s pode ser confundido com da distribuio Gaussiana
porque os dois se igualam quando se encontra uma particular distribuio Gaussiana que melhor seajusta a uma amostra dos dados.
Os parmetros de uma distribuio so encontrados ajustando-se estatsticas amostrais. Entretanto, no sempre o caso em que o
processo de ajuste to simples quanto o de uma distribuio Gaussiana, onde a mdia amostral se iguala ao parmetro e o

desvio-padro ao parmetro . Usualmente, para diferenciao a notao para as estatsticas amostrais envolve o uso de letras do
nosso alfabeto e para os parmetros da distribuio utilizam-se letras gregas.
4.3. Distribuies discretas versus distribuies contnuas.
Existem dois tipos distintos de distribuies tericas, correspondentes a diferentes tipos de dados ou variveis aleatrias. As
distribuies discretas descrevem quantidades aleatrias (isto , os dados de interesse) que podem ser tomados apenas em alguns
valores particulares. Isto , os valores permitidos so FINITOS, ou pelo menos contaveis. Por exemplo, uma varivel discreta aleatria
poderia ter apenas os valores 0 ou 1; ou qualquer dos inteiros no negativos; ou uma das trs cores vermelho, amarelo ou azul. Uma
varivel aleatria continua tipicamente pode tomar qualquer valor dentro de um intervalo especificado de nmeros reais. Por exemplo,
uma varivel aleatria contnua poderia ser definida com os nmeros reais entre 0 e 1; ou todos os nmeros reais no negativos; ou
para algumas distribuies qualquer nmero real.
Estritamente falando, o uso de uma distribuio contnua para representar dados observados implica que as observaes so
conhecidas para um nmero suficientemente grande de casos. Claro que isto nunca verdade totalmente, mas conveniente e no
to impreciso representar como contnuas aquelas variveis que so CONCEITUALMENTE contnuas mas obtidas de forma discreta.
Temperatura e precipitao so exemplos claros, pois variam em alguma poro da reta dos reais, mas que so obtidos em intervalos
discretos como 1 C ou 1mm. Pouco se perde em tratar estas observaes discretas como contnuas.
4.3.1. Distribuies Discretas.
Existe um grande nmero de distribuies de probabilidade tericas para variveis aleatrias discretas. Aqui vamos discutir algumas
delas, as mais importantes para a meteorologia.
i)

DISTRIBUIES BINOMIAIS:

A distribuio binomial provavelmente a mais simples distribuio terica possvel e, portanto, freqentemente empregada em livrostexto para ilustrar o uso e propriedades das distribuies tericas mais gerais. Esta distribuio pertence a situaes onde existem
dois eventos possveis de ocorrerem. Classicamente, estes dois eventos tm sido referidos como sucesso e falha, mas esta
atribuio meramente arbitrria. De maneira mais geral, um dos eventos (digamos o sucesso) designado com o nmero 1, e o
outro (falha) com o nmero zero.
A varivel aleatria de interesse, X, o nmero de ocorrncias do evento (dado pela soma de valores 1 ou 0) em um nmero
de tentativas. O nmero de tentativas N pode ser qualquer inteiro positivo e a varivel X pode tomar qualquer valor no negativo
inteiro variando de 0 (se o evento de interesse no ocorrer para todas as N tentativas) a N (se ocorrer em todas as ocasies). A
distribuio binomial pode ser usada para calcular probabilidades para cada um destes N+1 possveis valores de X se as duas
condies forem satisfeitas: 1) a probabilidade do evento ocorrer no mudar de tentativa para tentativa e 2) as sadas ou
resultados das N tentativas forem mutuamente independentes. Estas duas condies so raramente estritamente satisfeitas, mas
situaes reais podem ser prximas o suficiente a esta ideal tal que a distribuio binomial fornece representaes suficientemente
acuradas.
Uma implicao da primeira restrio, relacionando a constante ocorrncia de probabilidade, que os eventos cujas probabilidades
exibem ciclos regulares precisam ser tratados com cuidado. Por exemplo, o evento de interesse poderia ser uma tempestade ou a
ocorrncia de raios perigosos, em um local onde existe uma variao anual ou diurna na probabilidade do evento. Em casos como
este, sub-perodos (por exemplo, horas ou meses, respectivamente) com ocorrncia de probabilidades aproximadamente constantes
seriam usualmente analisados separadamente.
A segunda condio necessria para a aplicabilidade da distribuio binomial, relacionada independncia do evento, usualmente
mais problemtica para os dados atmosfricos. Por exemplo, uma distribuio binomial raramente seria diretamente aplicvel para a
ocorrncia ou no de precipitao diria. Isto porque existe freqentemente uma substancial dependncia dia-a-dia entre os eventos.
Ou seja, a chuva de hoje pode ter uma relao com a chuva de ontem e a de amanh. Assim, os eventos de chuva diria no so
freqentemente independentes. Entretanto, uma dependncia estatstica ano-a-ano na atmosfera usualmente fraca o suficiente tal
que as ocorrncias e no-ocorrncias de um evento em perodos anuais consecutivos podem ser consideradas efetivamente
independentes.
A ilustrao mais usual de uma distribuio binomial em relao ao experimento de se lanar uma moeda e obter cara ou
coroa. Se a moeda no est viciada e nem o jogador tem algum truque, as chances de ocorrer cara ou coroa so iguais a 0.5 e
no mudam de uma jogada para a outra. Se N>1 moedas so lanadas simultaneamente, o resultado para uma moeda no afeta as
outras. A situao das moedas satisfazem todos os requerimentos para a discrio de uma distribuio binomial. Trata-se de eventos
independentes com probabilidade constante e com uma evidente dicotomia.
Por exemplo, considere o caso onde N=3 moedas (no-viciadas) so lanadas simultaneamente, e estamos interessados no nmero
X de caras que podem resultar. Os valores possveis de X so: 0 (nenhuma cara), 1 (s uma moeda caiu cara), 2 (2 moedas
mostraram caras) e 3 (todas as 3 moedas mostraram cara). Tratam-se de 3 eventos mutuamente exclusivos e coletivamente
exaustivos (isto , eventos MECE) , o que significa que a soma das probabilidades necessariamente igual a 1. Vamos analisar o
resultado para as N+1 possibilidades:
1 possibilidade: 3 caras e 0 coroas (so eventos independentes) regra multiplicativa:

1 cara (Pr{E}=1/2) e 1 cara (Pr{E2}=1/2) e 1 cara(Pr{E3}=1/2) = ( )( ) ( ) = 1/8


2 possibilidade: 1 cara e 2 coroas
1 cara (Pr{E1}=1/2) e 1 coroa (Pr{E2}=1/2) e 1 coroa(Pr{E3}=1/2) = ( )( ) ( ) = 1/8
Ou (lembre-se da regra aditiva)
1 coroa (Pr{E1}=1/2) e 1 cara (Pr{E2}=1/2) e 1 coroa(Pr{E3}=1/2) = ( )( ) ( ) = 1/8
Ou (lembre-se da regra aditiva)
1 coroa (Pr{E1}=1/2) e 1 coroa (Pr{E2}=1/2) e 1 cara(Pr{E3}=1/2) = ( )( ) ( ) = 1/8
Probabilidade de 1 cara e 2 coroas: 1/8 + 1/8 + 1/8 = 3/8
3 possibilidade: 2 caras e 1 coroa
1 cara (Pr{E1}=1/2) e 1 cara (Pr{E2}=1/2) e 1 coroa(Pr{E3}=1/2) = ( )( ) ( ) = 1/8
Ou (lembre-se da regra aditiva)
1 coroa (Pr{E1}=1/2) e 1 cara (Pr{E2}=1/2) e 1 cara(Pr{E3}=1/2) = ( )( ) ( ) = 1/8
Ou (lembre-se da regra aditiva)
1 cara (Pr{E1}=1/2) e 1 coroa (Pr{E2}=1/2) e 1 cara(Pr{E3}=1/2) = ( )( ) ( ) = 1/8
Probabilidade de 2 caras e 1 coroa: 1/8 + 1/8 + 1/8 = 3/8
4 possibilidade: nenhuma cara ou 3 coroas (s uma regra multiplicativa)
1 coroa (Pr{E1}=1/2) e 1 coroa (Pr{E2}=1/2) e 1 coroa(Pr{E3}=1/2) = ( )( ) ( ) = 1/8
Genericamente, a probabilidade para os N+1 valores de X dada pela funo de distribuio de probabilidades para a distribuio
binomial :

N x N x
Pr{ X = x} = p (1 p)
x

(4.1)

O X (maisculo) indica a varivel aleatria cujo valor preciso desconhecido, ou tem ainda que ser observado. O x (minsculo)
denota um valor particular que a varivel aleatria pode ter. A distribuio binomial tem 2 parmetros, N e p. O parmetro p a
probabilidade de ocorrncia do evento de interesse (o sucesso) em cada um dos N independentes tentativas. Para um dado par de
parmetros N e p, a Eq. 4.1 uma funo que associa a probabilidade com cada um dos valores discretos x = 0,1,2,...,N, tal que a

x Pr{ X

= x} =1

O lado direito da Eq. 4.1. consiste de 2 partes: uma parte combinatria e outra parte de probabilidade. A parte que aparece anlise
combinatria especifica o nmero de jeitos distintos de realizar x sucessos a partir de uma coleo de N tentativas. A parte
combinatria dada por:

N N!
=
x !( Nx x) !

(4.2)

Por conveno 0! = 1. Por exemplo, jogando-se N=3 moedas, existe apenas um jeito que x=3 caras podem ser obtidas: todas as 3
moedas precisam mostrar caras. Usando-se a Eq. 4.2 , tem-se 3!/(3!0!) = (3 . 2 . 1)/(3 . 2. 1. 1)=1. Existe 3 jeitos nos quais x =1 pode
ser obtido = se a primeira, a segunda ou a terceira moeda mostrarem cara, com as restantes 2 moedas mostrando coroas. Usando-se
4.2 podemos obter 3!/(1!2!)=(3 . 2 . 1)/(1 . 2 . 1)= 3.
A parte da probabilidade da Eq. 4.1 segue a partir da lei multiplicativa da probabilidade para eventos independentes. A probabilidade
de um arranjo particular da ocorrncia de exatamente x eventos e N x no ocorrncias simplesmente p multiplicado por ele
mesmo x vezes, e ento multiplicado por 1 p (a probabilidade de no ocorrncia) N x vezes.

Ex. 1 Distribuio binomial e o congelamento do lago de Cayuga (Ex. Wilks, pg 68)


Considere os dados da Tab. 4.1 que listam os anos durante os quais o Lago Cayga, no centro do estado de Nova York, congelou. O
lago em questo bastante profundo e congela-se apenas aps um longo perodo de inverno excepcionalmente frio. In qualquer dado
inverno, a superfcie do lago CONGELA OU NO CONGELA (Quer dizer, no fica meio congelada). O fato de o lago congelar em um
dado inverno essencialmente independente se congelou nos anos mais recentes. A menos que tenha sido observado mudanas
climticas na regio nos ltimos 200 anos, a probabilidade que o lago ir congelar em um dado ano efetivamente constante.
Tab. 4.1 Anos em que o lago Cayga congelou (at 1994)
1796 1875 1912 1961
1816 1884 1934 1979
1856 1904
Portanto, podemos esperar que a distribuio binomial fornea uma boa descrio estatstica do congelamento do lago.
A fim de utilizar a distribuio binomial para esses dados, necessitamos ajustar a distribuio aos dados. O ajuste da distribuio
simplesmente significa encontrar valores particulares para os parmetros da distribuio, p e N neste caso, para os quais a Eq (4.1)
comportar-se- como os dados da Tabela 4.1. A distribuio binomial unique no sentido em que o parmetro N depende da
pergunta que querermos fazer, muito mais do que dos dados por si s. SE queremos calcular a probabilidade do lago congelar no
prximo inverno, ou em qualquer interno no futuro, ento N=1. [ O caso especial da Eq. (4.1) com N=1 chamado de DISTRIBUIO
DE BERNOULLI]. Se queremos calcular as probabilidades para o lago congelar em, digamos, uma vez em uma dcada, ento N=10.
O parmetro binomial, p, nesta aplicao a probabilidade de que o lago congele em qualquer dado ano. natural estimar esta
probabilidade usando a freqncia relativa dos eventos de congelamento nos dados. Esta questo um tanto difcil aqui,
principalmente porque no se sabe exatamente quando os registros comearam. De qualquer maneira, os registros claramente
comearam aps 1796, mas provavelmente comearam alguns anos antes disso. Suponha, por simplicidade, que os dados da Tabela
4.1 representam um registro de 200 anos. Os 10 eventos observados ento levam a uma freqncia relativa estimada para p binomial
de 10/200 = 0.05
Agora podemos aplicar a Eq. 4.1 para estimar as probabilidades dos eventos relacionados ao congelamento do lago. Os tipos mais
simples de eventos para se trabalhar relacionam o congelamento do lago exatamente um nmero especfico de vezes, x, em um
nmero especfico de anos N. Por exemplo, a probabilidade de o lago congelar exatamente uma vez em 10 anos :

10 1( 0.5) 011 10! 9


Pr{ X 1} == 0. 5 = (0. 5)(0. 5 )9 = 0.32
1 1!9
Poderamos pensar em um outro exemplo. Qual a probabilidade do lago congelar pelo menos uma vez em 10 anos? Como o
congelamento um evento mutuamente exclusivo, poderamos calcular a probabilidade de congelar 1, 2, 3,...10, e som-las todas.
Entretanto, podemos pensar num jeito mais interessante, que calcular o complementar da probabilidade do lago no congelar
nenhuma vez . Isto daria:

10!
(0.05)1 (0.9510 ) = 0.40
0!10!
importante lembrar que as distribuies binomiais podem ser aplicadas para situaes que no so intrinsecamente binrias,
atravs de uma redefinio adequada de eventos. Por exemplo, a temperatura no intrinsecamente binria e nem intrinsecamente
discreta. Contudo, para algumas aplicaes de interesse considerar a probabilidade de congelamento Pr{32F}. Junto com a
probabilidade do evento complementar Pr{T>32F}, a situao se qualifica como um evento dicotomizado, e poderia, portanto, ser
uma candidato a uma distribuio binomial.
Pr{ X 1} = 1 Pr{ X = 0} = 1

Vous aimerez peut-être aussi