Vous êtes sur la page 1sur 20

Hnlieding PQRS

(Probabilities, Quantiles and Random Samples)

Sytse Knypstra

Ynhld
Wurkje mei PQRS Wat kinne jo mei PQRS? Knsferdieling fstlizze Knsen berekkenje Kwantilen berekkenje Stekproeven lke, aselekt tawize knsferdielingen Begrippen Spesikaasjes Ferwizingen Literatuer diskrete ferdielingen: Mei einige drager: Bernoulli binomiaal diskreet unifoarm hypergeometrysk Mei ftelber neinige drager: geometrysk negatyf binomiaal Poisson Ferdielingen nder de nulhypoteze fan de toetsingsgrutheden by de folgjende toetsen: Wilcoxon rangtekentoets Wilcoxon rangsom toets Mann-Whitney toets Kruskal-Wallis toets Friedman toets kontinue ferdielingen: normaal gamma eksponensjeel chi-kwadraat Student t F Cauchy teard normaal beta unifoarm net-sintrale beta net-sintrale chi-kwadraat net-sintrale t net-sintrale F logistysk log-normaal Pareto Weibull Gumbel ynfers Gaussysk dbel-eksponensjeel

Wat kinne jo mei PQRS?


Mei PQRS kinne jo by in grut oantal knsferdielingen: a. knsen berekkenje, b. kwantilen berekkenje (it omkearde fan knsen), c. aselekte stekproeven lke. Foar de mooglikheden a oant en mei e moatte jo earst de knsferdieling fstlizze. Dat giet sa: 1. Daliks nei it opstarten is de aktuele ferdieling de (standert-) normale ferdieling (sjoch yn it nster nder Distribution). As jo in oare knsferdieling Fierder kinne jo: wolle: klik op it pylkje rjochts fan dizze namme en d. de grafyk fan de knsfunksje (by diskrete ferdielinkies t de list in oare ferdieling. gen) of de grafyk fan de knstichtensfunksje (by kon- 2. Liz de wearden fan de parameter(s) fst achter het tinue ferdielingen) besjen, = teken. e. de grafyk fan de kumulative ferdielingsfunksje (cdf) 3. Druk op Enter op het toetseboerd of klik mei de besjen, ms op Apply New Distribution. f. aselekt ienheden tawize oan behannelingen, dit wol sizze: aselekt de getallen 1, 2, . . . , n ferdiele oer in oan- Rjochts sjogge jo dan (eventueel op de earste tab klikke) nder pdf de knstichtensfunksje (as it giet om in tal groepen. kontinue ferdieling), nder pmf de knsfunksje (as it giet om in diskrete ferdieling) dyt heart by de nije knsferdieling.

Knsen berekkenje
As jo knsen berekkenje wolle by de selektearre ferdieling, en it tabbld dat boppe leit is pdf of pmf, fol dan in x-wearde yn yn it skonster fuort nder de grafyk (de lde wearde oerskriuwe). Druk drnei op Enter op het toetseboerd of klik mei de lofter msknop op Compute Probabilities. Het skonster is no fan plak feroare en boppedat steane yn de nsters dernder oare wearden. It lofter nster toant de kns P(X < x), it rjochter nster toant de kns P(X > x) en as de kns op de wearde x sels net nul is (komt inkeld foar by diskrete ferdielingen, dus by het tabbld pmf) dan is der ek noch in middelste nster rjocht nder it skonster mei de kns P(X = x). It is ek mooglik om it skonster mei de ms te ferslepen (met de lofter msknop op ien fan de twa skuven aan wjerskanten klikke en yndrukt hlde; drnei mei de ms nei lofts of nei rjochts bewege). As jo de lofter msknop loslitte, sjogge jo wer de lofter kns P(X < x), de rjochter kns P(X > x) en eventueel de kns P(X = x) yn e midden. As it boppe lizzende tabbld cdf is, dan ne jo ek in skonster direkt nder de grafyk. Ek yn dit skonster kinne jo in nije x-wearde ynere. Druk drnei op Enter op it toetseboerd of klik mei de lofter msknop op Compute Probabilities. Yn it nster, lofts neist de grafyk, ferskynt dan de kns P(X x). Dit komt oerien mei de wearde fan de kumulative ferdielingsfunksje yn it punt x, faak oantsjutten as F (x). Ek hjirre kinne wy it skonster mei de ms ferslepe.

Kwantilen berekkenje
Op de foarrige side waard beskreaun hoet jo knsen berekkenje kinne dyt hearre by in bepaalde x-wearde. Jo kinne it ek oarsom dwaan en sykje in x-wearde by in bepaalde kns. Kwantilen binne x-wearden dyt sa keazen wurde dat de kns op x of op in lytsere wearde as x gelyk is oan in spesisearre kns. Jo kinne se it maklikst berekkenje as it boppe lizzende tabbld cdf is. As bygelyks de selektearre ferdieling de standert-normale ferdieling is en jo sykje it kwantyl by de kns 0,975, fol dan 0,975 yn yn it ynfolnster lofts fan de grafyk. Druk op de toets Enter op it toetseboerd of klik mei de lofter msknop op Compute Quantile en yn it skonster nder de grafyk ne jo de byhearrende x-wearde, nammentlik 1,96. As it boppe lizzende tabbld pdf is, giet it krekt sa maklik. Nu folle jo de kns 0,975 yn yn it lofter knsnster en jo drukke op Enter of jo klikke op Compute Quantile. As it boppe lizzende tabbld pmf is, dus yn it gefal fan diskrete ferdielingen, is der ornaris net in x-wearde dyt krekt oan de eask foldocht dat de kns P(X x) gelyk is oan de foarskreaune kns. Yn dat gefal wurdt de xwearde nommen drt de kns op P(X x) justjes grutter is. As it boppe lizzende tabbld pdf of pmf is, kinne jo ek de kns P(X > x) fst lizze, op Enter drukke of op Compute Quantile klikke en de bybehearrende x-wearde ne. As it tabbld pmf is, dan sil ornaris gjin x-wearde fn wurde kinne dyt presys oan de eask foldocht. Yn dat gefal wurdt de x-wearde nommen drt de kns P(X > x) justjes lytser foar is as opjn wie.

Stekproeven lke, aselekt tawize


It kin bytiden nedich wze om by in proef aselekt eksperimentele ienheden ta te wizen oan behannelingen. Stel dat jo aselekt 75 proefpersoanen yndiele wolle yn trije groepen. Kies dan t it menu: Sample en drnei: Randomly assign. Jo sjogge dan in dialoochnster drt jo efter inoar it oantal ienheden en it oantal groepen ynfolle kinne. Dizze stekproefwearden kinne kopieard wurde nei it Druk op OK en der ferskynt in tabbld sample mei like klemboerd mei de toetsekombinaasje Ctrl-C of weisfolle kolommen mei nmers as der groepen binne; de kreaun wurde nei in bestn: kies t it menu: Sample en nmers (yn s gefal 1 oant en mei 75) binne aselekt drnei Save. ferdield yn trije groepen. Om it tabbld sample te feien: kies t it menu: Sample Dizze yndieling kin kopieard wurde nei it klemboerd mei de toetsekombinaasje Ctrl-C of weiskreaun wurde en drnei Clear. nei in bestn: kies t it menu: Sample en drnei Save. Om it tabbld sample te feien: kies t it menu: Sample en drnei Clear. By eltse selektearre knsferdieling is it mooglik in aselekte stekproef te lken. Kies t it menu: Sample en drnei: Draw random sample. Jo sjogge dan in dialoochnster drt jo de grutte fan de stekproef (n) yn opjaan moatte. Druk op OK en de tkomsten fan de stekproef ferskine op in apart tabbld sample.

Begrippen
In stochastyske fariabele is in fariabele dyt ferskillende wearden oannimme kin; de wearde dyt oannommen wurdt, hinget f fan it tafal. In stochastyske fariabele wurdt meastal oantsjutten mei in haadletter, bygelyks X . By in stochastyske fariabele heart altyd in knsferdieling. In knsferdieling leit fst hoe grut de knsen op wearden x of knsen op ynterfallen a < x < b binne. Knsen lizze altyd tusken 0 en 1. De knsferdielingen yn PQRS binne f diskreet f kontinu. By in diskrete ferdieling wurde de knsen op bepaalde wearden x jn; dy knsen binne posityf en de som fan alle knsen is 1. Foarbylden binne de binomiale ferdieling en de Poisson-ferdieling. By in kontinue ferdieling wurde de knsen op ynterfallen jn troch in hulpfunksje te brken, de knstichtensfunksje. De kns op in ynterfal (a, b) is dan de oerakte nder de grafyk fan knstichtensfunksje en boppe dit ynterfal. De totale kns, dus de kns op it ynterfal (, ) is 1. Foarbylden binne de normale ferdieling en de eksponensjele ferdieling. De (kumulative) ferdielingsfunksje F (x) (Ingelsk: cdf) jout foar elts reel getal x de kns op in wearde lytser of gelyk oan x, dus F (x) = P(X x). De ferdielingsfunksje is altyd in net-dalende funksje mei wearden tusken 0 en 1. As gefolch fan boppesteande denysje is hy kontinu fan rjochts: as F (x) earne in spronkje makket, dan hat hy yn it sprongpunt de wearde dyt oanslt by de wearden rjochts drfan.

Begrippen
In kwantyl by in beskate kns p is de x-wearde drt foar F (x) = p. Dit jildt foar kontinue ferdielingen. Foar diskrete ferdielingen is ornaris net in x-wearde te nen dyt hjir eksakt oan foldocht. Yn dat gefal wurdt yn PQRS x sa keazen dat F (x) justjes grutter is as p. De drager fan in ferdieling is by in diskrete ferdieling de samling fan x-wearden wrt de kns op grutter as 0 is. By in kontinue ferdieling is it de samling fan x-wearden wrt de knstichtensfunksje posityf is. De ferwachting(swearde) is in maat foar it sintrum fan de ferdieling. Jo kinne it opfetsje as it swiertepunt: als jo jo de knsferdieling foarstelle as in massaferdieling op in balkje, dan is de ferwachting it punt wrt jo de balke nderstypje moatte sa dat hy yn lykwicht bliuwt. De ferwachting hoecht by in diskrete ferdieling net gelyk te wzen oan ien fan e wearden x mei in positive kns. De ferwachting fan de stochastyske fariabele X wurdt oantsjutten mei E(X ). De farinsje is in maat foar de sprieding fan de ferdieling. In oare maat foar de sprieding is de standertfwiking; dit is de woartel t de farinsje. Behalve troch de knstichtensfunksje, de knsfunksje of de kumulative ferdielingsfunksje, kinne jo in knsferdieling soms ek fstlizze troch de momenten generearende funksje (mgf). Guon eigenskippen fan knsferdielingen binne maklik f te lieden t harren momenten generearende funksjes. De formele denysje giet sa (yn de omkriten fan it punt t = 0): M (t) = E(etX ).

Spesikaasjes
Bernoulli parameter(s) drager knsfunksje ferwachting farinsje mgf 0<p<1 x = 0, 1 P(X = 0) = 1 p en P(X = 1) = p p p(1 p) 1 p + pet binomiaal n = 1, 2, . . ., 0<p<1 x = 1, 2, . . . , n (n) x nx x p (1 p) np np(1 p) (1 p + pet )n Poisson >0 x = 0, 1, . . .
e x x!

diskreet unifoarm M gehiel N gehiel; M < N x = M, M + 1, . . . , N


1 N M +1 M +N 2 (N M )(N M +2) 12 eM t +e(M +1)t ++eN t N M +1

e(e 1)
t

De Bernoulli ferdieling is in bysnder gefal fan de binomiale ferdieling (n = 1). De knsferdieling fan it oantal suksessen by n nfhinklike eksperimenten elts mei kns p op sukses hjit binomiaal. Foar de knsferdieling fan it oantal kearen dat in barren foarkomt yn in bepaald tiidsynterfal wurdt faak de Poisson ferdieling brkt. Foarbyld fan de diskreet unifoarme ferdieling: de tkomst fan in goai mei in dobbelstien (M = 1, N = 6).

Spesikaasjes
hypergeometrysk parameter(s) N = 2, 3, . . . N1 = 1, . . . , N 1 n = 1, . . . , N 1 x = max(0, n N + N1 ), . . . , min(n, N1 ) 1 N N1 (N x )( nx ) (N n)
nN1 N nN1 (N N1 )(N n) N 2 (N 1)

geometrysk 0<p<1

negatyf binomiaal r = 1, 2, . . . 0<p<1 x = 0, 1, . . . (r+x1) r p (1 p)x x


r(1p) p r(1p) 2 [ p

drager knsfunksje ferwachting farinsje mgf

x = 0, 1, . . . p(1 p)x
1p p 1p p2 p 1(1p)et

p (1(1p)et )

]r

De hypergeometryske ferdieling komt foar yn de folgjende situaasje: in samling befettet N objekten. Hjirfan hawwe N1 in bepaalde eigenskip. n objekten wurde aselekt snder se werom te lizzen t de samling lutsen. It oantal lutsen objekten mei dy eigenskip hat dan in hypergeometryske ferdieling. De geometryske ferdieling is in spesjaal gefal fan de negatyf binomiale ferdieling (r = 1). De ferdieling fan it oantal mislearringen foar it r-de sukses yn in rige fan nfhinklike Bernoulli eksperimenten mei kns p op sukses is negatyf binomiaal. Pas op: soms wurdt de negatyf binomiale ferdieling deniearre as it oantal eksperimenten oant en mei it r-de sukses yn in rige fan nfhinklike Bernoulli eksperimenten mei kns p op sukses.

Spesikaasjes
Wilcoxon rangtekentoets parameter(s) drager ferwachting farinsje n = 1, 2, . . .
+1) x = 1, 2, . . . , n(n2 1 4 n(n + 1) 1 24 n(n + 1)(2n + 1)

Wilcoxon rangsom toets m = 1, 2, . . . n = 1, 2, . . . +1) +1) x = m(m , . . . , m(m + mn 2 2 1 2 m(m + n + 1) 1 12 mn(m + n + 1)

Mann-Whitney toets m = 1, 2, . . . n = 1, 2, . . . x = 0, . . . , mn 1 2 mn 1 12 mn(m + n + 1)

De Wilcoxon rangtekentoets wurdt brkt om de nulhypoteze fan symmetry te toetsen. As 0 it symmetrypunt is, dan is de toetsingsgrutheid de som fan de rangnmers fan de positive waarnimmings. De Wilcoxon rangsom toets en de Mann-Whitney toets wurde beide brkt om de gelikens fan de lokaasje fan twa populaasjes te toetsen. By de Wilcoxon rangsomtoets is de toetsingsgrutheid R de som fan de rangnummers dyt hearre by de earste stekproef (mei m eleminten). By de Mann-Whitney toets is de toetsingsgrutheid U gelyk oan it oantal pearen (xi , yj ) fan waarnimmings xi t de earste stekproef en yj t de twadde stekproef, wrt foar xi > yj . 1 m(m + 1). De twa toetsen binne ekwivalint: Wilcoxons Rangsom R = Mann-Whitneys U + 2

Spesikaasjes
Kruskal-Wallis toets parameter(s) drager k = oantal groepen, n1 = 1, 2, . . . , n2 = 1, 2, . . . , x0 ..., nk = 1, 2, . . . Friedman toets k = oantal behannelingen, b = oantal blokken x0

De toets fan Kruskal-Wallis wurdt brkt foar it toetsen fan ferskillen yn ferwachte behannelingen tusken k > 2 groepen as der gjin normale ferdielingen foar de waarnimmings ndersteld wurde kinne. De toetsingsgrutheid H wurdt berekkene op grn fan de rangnmers dyt oan de waarnimmings (as se allegearre byinoar nommen wurde) k ( ) 12 N +1 2 tawiisd wurde en is gelyk oan N (N n R . Hjirby is N it totale oantal waarnimmings, ni is it i i. 2 +1) oantal waarnimmings yn groep i, en Ri. is it gemiddelde rangnmer fan de waarnimmings yn groep i. De toets fan Friedman wurdt brkt om ferskillen tusken behannelingen te toetsen yn in folslein fertize blokntk ( )2 12N werp. De toetsingsgrutheid is Q = k( Ri. 1 2 (k + 1) k+1) (selde notaasje as by Kruskal-Wallis).
i=1 i=1

De eksakte ferdieling fan de toetsingsgrutheden H en Q kin yn PQRS allinnich binnen ridlike tiid berekkene wurde as it oantal groepen net te grut is en it oantal waarnimmings lyts is. Yn oare gefallen kinne jo de ferdieling fan H likegoed as Q benei komme mei in chi-kwadraat ferdieling mei k 1 frijheidsgraden.

Spesikaasjes
normaal parameter(s) drager knstichtens ferwachting farinsje mgf 2 > 0 (of > 0) < x <
1 e 2 2
(x)2 2 2

gamma >0 >0 x>0


1 x e () x 2 ( ) t

eksponensjeel >0 x>0 ex


1 1 2 t

chi-kwadraat >0 x>0


2 x 2 2 x 2 e 2 ( ) 2

2 et+ 2
1 2 2

2 (1 2t) 2

De Gaussyske of normale ferdieling spilet in tige belangrike rol yn de statistyk, nder mear fanwege de Sintrale Limyt Stelling: as X1 , ..., Xn nfhinklik binne en gelyk ferdield (met einige farinsje) dan is de ferdieling fan harren som (en harren gemiddelde) likernch normaal. Bysnder gefal: de standert-normale ferdieling, mei = 0 en 2 = 1. 1 nommen. By de gamma ferdieling wurdt soms yn pleats fan as twadde parameter = De eksponensjele ferdieling is in spesjaal gefal fan de gamma ferdieling ( = 1) en in spesjaal gefal fan de Weibull ferdieling (b = 1); hja wurdt brkt by it modellearen fan wachttiden. 1 De chi-kwadraatferdieling is ek in spesjaal gefal fan de gamma ferdieling ( = 2 en = 2 ). As it oantal frijheidsgraden tige grut is, komt PQRS de chi-kwadraat ferdieling benei mei in normale ferdieling.

Spesikaasjes
Student t parameter(s) drager knstichtens ferwachting farinsje >0 < x <
( +1 x2 +1 2 ) 1 2 (1 + ) ( ) 2

F m>0 n>0 x>0


n n ( m+ m m m2 mx m+ 2 ) 2 n ( n ) 2 x 2 (1 + n ) ( m )( ) 2 2

Cauchy >0 < x <


a 1+( x b )

1
2

0 als > 1; bestiet net as 0 < 1 als > 2; bestiet net as 0 < 2
2

n n2 2n2 (m+n2) m(n2)2 (n4)

bestiet net bestiet net

By in aselekte stekproef t in normale ferdieling kinne jo de nulhypoteze toetse dat in bepaalde wearde hat. As toetsingsgrutheid brke jo dan in grutheid dyt de t-ferdieling hat. Itselde jildt foar it ferlykjen fan de s fan twa normale ferdielingen. Als it oantal frijheidsgraden tige grut is, komt PQRS de t-ferdieling benei mei in standert-normale ferdieling. De F-ferdieling wurdt brkt foar toetsen fan gelikens fan twa farinsjes by stekproeven t normale ferdielingen en boppedat yn it ramt fan de analyze fan linere modellen (linere regressy en farinsjeanalyze). As it oantal frijheidsgraden tige grut is, komt PQRS de F -ferdieling benei mei in chi-kwadraat ferdieling. De Cauchy ferdieling is in spesjaal gefal fan de Student t-ferdieling ( = 1). In bysndere eigenskip fan de Cauchy ferdieling is dat de ferwachting en de farinsje net bestean.

Spesikaasjes
teard normaal parameter(s) 2 > 0 x0 f (x) + f (x) 2 2 2 2 e +{12F (0)} 2 + 2 { E(X )}2 beta >0 >0 0<x<1 1 1 (1 x) 1 B(, ) x
+ (+ +1)(+ )2

unifoarm > <x<


1 + 2 ( )2 12 et et ( )t

net-sintrale beta >0 >0

drager knstichtens ferwachting farinsje mgf

De tearde normale ferdieling is de ferdieling fan X = |Y | as Y in normale ferdieling hat mei parameters en 2 . De funksjes f (.) en F (.) yn dizze kolom binne de knstichtens en kumulative ferdielingsfunksje fan Y . De beta ferdieling hat in positive knstichtens allinnich op it ynterfal 0 < x < 1. Foar de parameters = 0 en = 1 is de unifoarme ferdieling in bysnder gefal fan de beta ferdieling (mei = 1 en = 1). De net-sintrale beta ferdieling hinget nau gear mei de net-sintrale F -ferdieling. De programmearing fan de net-sintrale beta ferdieling is basearre op it artikel fan Frick (1990).

Spesikaasjes
net-sintrale chi2 parameter(s) >0 0 x>0 + 2 + 4 net-sintrale F m>0 n>0 0 x>0 ( n )2
m (m+)n m(n2) (2m+4)(n2)+2(m+)2 (n2)2 (n4)

net-sintrale t >0 < x < 1 ( 2 ) 2 ( 2 ) [ ]2 1 (1+ 2 ) ( 2 ) n2 2 ( )


2

drager ferwachting farinsje

As X1 , . . . , Xk nfhinklik binne en Xi N(i , 1), dan hat U = Xi2 in net-sintrale chi-kwadraat k i=1 ferdieling mei k frijheidsgraden en net-sintraliteitsparameter = i=1 2 i. As wy, nfhinklik fan U , in fariabele V deniearje dyt in sintrale chi-kwadraat ferdieling hat mei m frijheidsU/k graden, dan hat F = V /m in net-sintrale F ferdieling mei k en m frijheidsgraden en net-sintraliteitsparameter . As X N(, 1), en V hat, nfhinklik fan X , in sintrale chi-kwadraat ferdieling mei m frijheidsgraden, dan hat T = X in net-sintrale t ferdieling mei m frijheidsgraden en net-sintraliteitsparameter .
V /m

As de net-sintraliteitsparameter 0 is, dan giet it om in sintrale ferdieling mei deselde namme. By de programmearing fan de net-sintrale ferdielingen binne de ideen tapast t it artikel fan Frick (1990).

Spesikaasjes
logistysk parameter(s) drager cdf ferwachting farinsje mgf >0 < x <
x 1+e

Gumbel >0 < x < exp[ exp((a x)/b)] + 0.577216


2 2 6 et (1 t)

Pareto >0 >0 x> [( ) ] 1 x


1

2 2 3 et (1 t)(1 + t)

bestiet net

Spesikaasjes
Weibull parameter(s) drager knstichtens ferwachting farinsje mgf a>0 b>0 x>0
b abxb1 eax

log-normaal 2 > 0 x>0


1 e 2 2 x2 2 e+ 2
2

ynfers Gaussysk >0 >0 x>0


2

dbeleksponensjeel >0 < x <

(ln x)2 2 2

e 2x3

(x)2 2 2 x

1 2 e

|x|

a b (1 + 1 b)
1

2 2

a [(1 + 2 b) 1 2 (1 + b )]

2 b

e2+2 e2+

et 1(t)2

De dbel-eksponensjele ferdieling wurdt ek wol de Laplace ferdieling neamd.

Literatuer
Foar in moai skema oer de relaasjes tusken de verskate Foar de programmearing fan PQRS is brkt: ferdielingen ferwize wy nei Casella, G., Berger, R.L. (2002) Statistical Infe- W.H.Press, B.P.Flannery, S.A.Teukolsky, W.T.Vetterling (1989) Numerical Recipes in Pasrence (2nd ed.) cal. Detaillearre ynformaasje oer knsferdielingen stiet yn de P. LEcuyer (1988) Ecient and Portable Combirige Distributions in Statistics fan Johnson en Kotz: ned Random Number Generators, Communications of N.L.Johnson, S.Kotz (1969) Distributions in Statisthe ACM, Vol. 31 Nr 6 (June 1988). tics, discrete distributions. N.L.Johnson, S.Kotz (1970) Distributions in Statis- L. Devroye (1986), Non-uniform Random Variate tics, continuous univariate distributions-1. Generation. N.L.Johnson, S.Kotz (1970) Distributions in Statistics, continuous univariate distributions-2. H. Frick (1990) Algorithm AS R84. A remark on Algorithm AS 226: computing non-central beta probabilities., Appl. Stat. 39: pp. 311-312. Jo kinne PQRS binnenhelje op jo eigen kompjter fan http://members.home.nl/sytse.knypstra/PQRS/ It programma PQRS is ntwurpen en skreaun troch Sytse Knypstra yn de programmeartaal Delphi. Syn e-mail adres is: Sytse.Knypstra@home.nl.

Literatuer

Vous aimerez peut-être aussi