Vous êtes sur la page 1sur 79

Wnioskowanie Statystyczne D.

Kosiorowski 2007/2008


1
WNIOSKOWANIE STATYSTYCZNE
W ekonomii pewne interesujce nas zjawisko traktujemy jako jedno bd wielowymiarow
zmienn losow. Rozkad prawdopodobieostwa tej zmiennej losowej na og nie jest znany,
posiadane informacje pozwalaj jedynie wyrnid rodzin rozkadw do ktrej naley rozkad
tej zmiennej losowej.





Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


2
Przykad:
Dzienny utarg sklepu jest zmienn losow ) , , .
Celem wnioskowania statystycznego jest przedstawienie pewnych syntetycznych
informacji o rozkadzie zmiennej losowej reprezentujcej interesujce zjawisko na podstawie
pewnego zbioru informacji dotyczcych zjawiska (wynikw eksperymentu, prby).






Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


3





Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


4
Trjk , gdzie jest rodzin rozkadw prawdopodobieostwa nazywamy
przestrzeni statystyczna.
W wielu interesujcych z praktycznego punktu widzenia przypadkach rodzin moemy
przedstawid w postaci , gdzie jest pewnym zbiorem parametrw.
Przestrzeo statystyczna suy do opisu zbioru moliwych mechanizmw rzdzcych
eksperymentem losowym.





Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


5
Przykad: Rozwaamy jednokrotny rzut monet. Oznaczmy przez
prawdopodobieostwo otrzymania ora. Przyjmujemy, e wynikiem eksperymentu jest
wyrzucenie ora albo reszki. Oznaczajc te zdarzenia odpowiednio przez i , mamy:
,
rodzina moliwych rozkadw prawdopodobieostwa: ,
gdzie , , , .





Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


6
Jeeli , to mwimy, e eksperyment losowy jest opisany k wymiarowym
modelem parametrycznym. Jeeli nie da si przedstawid jako podzbir dla adnego
, to mwimy, e eksperyment jest opisany modelem nieparametrycznym.








Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


7
Podstawowym zadaniem statystyki jest podanie metod, ktre umoliwiaj wskazanie
rozkadu, rzdzcego eksperymentem losowym, na podstawie obserwacji jego wyniku . Na
og wyrnia si trzy typy takiej identyfikacji:








Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


8
1. Estymacja punktowa polega na oszacowaniu nieznanego parametru za pomoc
funkcji, ktrej argumentami s obserwacje , wartociami za s poszczeglne wartoci
parametru ;










Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


9
2. Estymacja przedziaowa polega na oszacowaniu nieznanego parametru za
pomoc funkcji, ktrej argumentami s obserwacje , wartociami za s podzbiory
przestrzeni parametrw ;










Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


10
3. Testowanie hipotez polega na wyodrbnieniu, przed przeprowadzeniem
eksperymentu, takich dwu rozcznych zbiorw , dla ktrych ,
wykonaniu eksperymentu losowego, a nastpnie podjciu na podstawie jego wynikw
decyzji, w ktrym ze zbiorw znajduje si nieznany parametr .







Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


11
Na og atwiej jest wskazad waciwy rozkad prawdopodobieostwa, jeeli wielokrotnie
powtrzymy eksperyment.
N-krotne powtrzenie eksperymentu losowego okrelamy mianem prby
losowej jeeli oznaczaj zmienne losowe. Jeeli zmienne losowe s
niezalene i maj ten sam rozkad, to mwimy, e prba losowa jest prosta.






Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


12
Dla zdarzenia elementarnego liczby nazywamy
realizacj prby losowej , odpowiadajc zdarzeniu elementarnemu .









Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


13
Kada funkcja o wartociach rzeczywistych, ktrej argumentami s realizacje prby
losowej, generuje pewne odwzorowanie , okrelone w nastpujcy sposb:
.
Jeeli odwzorowanie jest zmienn losow, to nazywamy j statystyk.






Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


14
Przykady statystyk:
rednia z prby
Niech bdzie prb losow. redni z prby nazywamy statystyk
.





Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


15
Wariancja z prby:
Wariancj z prby losowej , dla ktrej , gdzie jest znane,
nazywamy statystyk

Gdy nie jest znane , wariancj z prby nazywamy statystyk




Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


16
Dystrybuanta empiryczna:
Dla danej prby prostej , dystrybuanta empiryczna w punkcie jest
okrelona nastpujcym wzorem:

gdzie dla dowolnego przez oznaczamy tzw. funkcj wskanikow zbioru:
,




Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


17
POLSKA POWIATY 2000 PRZYROST NATURALNY
-9,23
-8,14
-7,06
-5,97
-4,89
-3,80
-2,71
-1,63
-0,54
0,54
1,63
2,71
3,80
4,89
5,97
7,06
8,14
9,23
0
50
100
150
200
250
300
350
400
l
i
c
z
b
a

o
b
s
e
r
w
a
c
j
i




Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


18
Wspczynnik korelacji z prby:
Niech dana bdzie prba prosta , ktrej elementami s dwuwymiarowe
wektory. Wspczynnik korelacji z prby jest okrelony nastepujacym wzorem:






Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


19
Histogram z prby:
POLSKA POWIATY 2000 r.
POW. MIESZK. NA 1 MIESZK.
0%
0%
1%
7%
20%
27%
24%
10%
7%
3%
1%
0%
0%
13 14 15 16 17 18 19 20 21 22 23 24 25 26
POW. MIESZK. NA 1 MIESZK.
0%
5%
11%
16%
21%
27%
32%
P
e
r
c
e
n
t

o
f

o
b
s
0
20
40
60
80
100
120



Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


20
Estymacja punktowa
Niech bdzie prb losow w modelu opisanym za pomoc przestrzeni
statystycznej , gdzie . Na og jest tak, e rozkad
prawdopodobienstwa danej statystyki zaley od parametru . Obserwacje
statystyki mona wykorzystad do wnioskowania o parametrze .
Kad statystyk , ktra przyjmuje wartoci z przestrzeni parametrw ,
bdziemy nazywad estymatorem parametru .




Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


21
Nieobciono estymatora
Oznaczmy przez estymator parametru rozkadu zmiennej losowej w
populacji obliczany w oparciu o prb losow .
Jeeli ma miejsce: ,
to mwimy, e jest estymatorem nieobcionym.
/ Posugujc si estymatorem nieobcionym rednio rzecz biorc trafiamy w prawdziw
wartod parametru /




Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


22
Przykady:
W przypadku gdy , to

rednia arytmetyczna z prby jest nieobcionym estymatorem wartoci oczekiwanej w
populacji.






Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


23
Niech oraz niech , w przypadku, gdy
znamy wartod oczekiwan w populacji wtedy
.
W przypadku, gdy nie znamy wartoci oczekiwanej w populacji mamy:





Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


24
Dlatego te wprowadza si nieobciony estymator wariancji:

Mamy wwczas:

Obcieniem estymatora parametru nazywamy wielkod .




Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


25
Estymatory zgodne
Niech bdzie cigiem niezalenym zmiennych losowych o tym samym rozkadzie
zalecym od parametru rzeczywistego . Niech bdzie estymatorem
parametru , otrzymanym na podstawie obserwacji . Mwimy, e jest
zgodny, jeeli dla kadego ,
.





Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


26
Zgodnod oznacza, e dla dostatecznie duych licznoci prby estymator przyjmuje z
duym prawdopodobieostwem wartoci bliskie estymowanemu parametrowi .
Przykady estymatorw zgodnych:
rednia arytmetyczna, mediana z prby







Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


27
Mwimy, e estymator parametru jest mocno zgodny, jeeli speniony jest warunek

Mocna zgodnod oznacza, e z prawdopodobieostwem 1 realizacje estymatora d, przy
, do estymanowanego parametru.
Przykady estymatorw mocno zgodnych :
rednia arytmetyczna, dystrybuanta empiryczna




Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


28
Odporno estymatora
Oznaczmy przez estymator, odwzorowanie przyporzdkowujace jeden bd wicej
parametrw z ustalonego zbioru parametrw kademu rozkadowi zmiennej losowej o
wartociach w zbiorze .
Rozwamy wszelkie zanieczyszczone prby n elementowe , ktre uzyskujemy przez
zastpienie obserwacji w n elementowej prbie z rozkadu dowolnymi obserwacjami
(np. obserwacjami odstajcymi).






Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


29
Oznaczmy przez maksymalne obcienie, ktre moe powstad przez takie
zastpienie: , gdzie supremum brane jest po wszystkich
prbach .











Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


30
W przypadku, gdy jest nieskooczone, tzn. jednostek odstajcych moe mied
dowolnie wielki wpyw na , mwimy, e estymator amie si. Punkt zaamania estymatora
w prbie definiowany jest jako:

.

Innymi sowy jest to najmniejsza frakcja zastpienia, ktra moe sprawid, e estymator
przyjmuje wartoci dowolnie odlege od wielkoci, ktr estymuje.




Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


31
Punkt zaamania redniej arytmetycznej z prby wynosi 0% - zaledwie jedna odstajca
obserwacja jest w stanie znieksztacid analiz prowadzona za pomoc redniej, punkt zaamania
mediany z prby jest bliski 49%.







Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


32
Estymacja przedziaowa
Niech dana bdzie prba losowa , ktrej rozkad zaley od pewnego parametru
rzeczywistego . Przedziaem ufnoci dla parametru na poziomie ufnoci
nazywamy przedzia speniajcy warunki:
1) oraz s funkcjami prby losowej nie zale
jednak od .
2) Dla kadego ,
.




Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


33
Kooce przedziau ufnoci s zmiennymi losowymi, jednak dla duej liczby realizacji
przedziau ufnoci czstod pokrycia parametru przedziaem jest w przyblieniu rwna
.
Rnica nazywana jest dugoci przedziau ufnoci.






Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


34
Przykad 1
Interesujca nas cecha w populacji jest zmienn losow o rozkadzie normalnym ) , nie
znamy ale znamy . Pobieramy n elementow prb prost z populacji tzn. .
Wiemy, e statystyka






Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


35
Ustalamy pewn liczb np.
W tablicach rozkadu szukamy liczby , ktra spenia ,
y=normal(x;0;1)
-3,00 -1,96 0,00 1,96 3,00
0,0
0,1
0,2
0,3
0,4
0,5
0,6




Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


36
Rozwizujemy nierwnod wzgldem :

Otrzymujemy:

Przedzia postaci jest przedziaem ufnoci dla nieznanej wartoci
oczekiwanej .



Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


37
Przykad 2
Interesujca nas cecha w populacji jest zmienn losow o rozkadzie normalnym ) , nie
znamy , nie znamy take . Pobieramy n elementow prb prost z populacji tzn.
( .
Wiemy, e statystyka

ma rozkad - Studenta o stopniach swobody.



Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


38
Ustalamy pewn liczb np.
W tablicach rozkadu Studenta o szukamy liczby , ktra spenia
,
np. dla prby 4 elementowej
y=student(x;4)
-3,00
-2,13
-2,00
-1,00
0,00
1,00
2,00
2,13
3,00
0,0
0,1
0,2
0,3
0,4
0,5


Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


39
Rozwizujemy nierwnod wzgldem :

Otrzymujemy:

Przedzia postaci jest przedziaem ufnoci dla nieznanej wartoci
oczekiwanej .



Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


40
Interpretacja:
Realizacje przedziau ufnoci na og rni si od prby do prby jednak dla ustalonego
wspczynnika ufnoci czstod pokrycia przez realizacj przedziau ufnoci nieznanego
parametru bdzie w przyblizeniu rwna . Precyzj oszacowania przedziaowego mona
wiazad z dugoci przedziau ufnoci. Na og im wyszy przyjmiemy wspczynnik ufnoci tym
nisza bdzie precyzja oszacowania przedziaowego.





Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


41
Testowanie hipotez
Dana jest pewna przestrzeo statystyczna , gdzie , ,
. Stwierdzenia, ktre maj postad oraz bdziemy nazywad
hipotezami statystycznymi i bdziemy oznaczad odpowiednio literami i . Hipotez
bdziemy nazywad hipotez alternatywn dla hipotezy zerowej .
Hipotez nazywamy prost, jeeli odpowiadajcy jej zbir , zawiera tylko jeden
parametr, w przeciwnym razie mwimy o hipotezie zoonej.




Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


42
Testem statystycznym nazywamy metod postpowania, ktra moliwym realizacjom
prby losowej , okrelonej na przestrzeni statystycznej przypisuje
decyzj odrzucenia (albo przyjcia) weryfikowanej hipotezy.








Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


43
W celu zbudowania testu do weryfikacji postawionej hipotezy naley skonstruowad dwa
dopeniajce si zbiory i ( , ) oraz pewn statystyk ,
nazywan statystyk testow, przy czym:
Jeeli to odrzucamy na rzecz
Jeeli to przyjmujemy.
Zbir K nazywamy zbiorem krytycznym, zbir W nazywamy zbiorem przyj.





Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


44
W procedurze decyzyjnej, przy weryfikacji ustalonej hipotezy bdem I go rodzaju
nazywamy odrzucenie na podstawie wynikw prby losowej weryfikowanej hipotezy wtedy,
gdy jest ona prawdziwa, a bdem II go rodzaju nazywamy przyjcie na podstawie
wynikw prby weryfikowanej hipotezy wtedy, gdy jest ona faszywa







Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


45
Jeeli H
0
i H
1
s hipotezami prostymi tzn.: wwczas
prawdopodobieostwa bdw pierwszego i drugiego rodzaju obliczamy odpowiednio:









Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


46
- prawdopodobieostwo, e
wartod statystyki testowej wpadnie do zbioru krytycznego K gdy wartod parametru wynosi
;








Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


47
- prawdopodobieostwo, e
wartod statystyki testowej wpadnie do zbioru przyjd W, gdy wartod parametru wynosi
.
Uwaga: zbiory K i W wyznaczamy zakadajc prawdziwod H
0







Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


48
Moc testu nazywamy prawdopodobieostwo podjcia prawidowej decyzji polegajcej na
odrzuceniu weryfikowanej hipotezy na podstawie wynikw z prby, gdy jest ona faszywa.
Moc testu
prawdopodobieostwo, e odrzucimy
hipotez gdy prawdziwa jest hipoteza alternatywna .






Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


49
Testem najmocniejszym nazywamy test, ktry jest oparty na takim zbiorze krytycznym
K
0
(tym samym na zbiorze przyjd W
0
), dla ktrego przy ustalonym z gry
prawdopodobieostwie bdu I- go rodzaju, prawdopodobieostwo bdu II go rodzaju jest
najmniejsze.






Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


50
Przykad:
; vs. ; w przypadku gdy wnioskujemy w oparciu o jedna
obserwacj z :
"H_1 = Normal(x;7;2)" ; "H_0 = Normal(x;5;2)"
0,00 2,00 4,00 6,00 7,56 10,00 12,00 14,00
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
0,18
0,20
alfa = 0.1
beta (prawd bdu II rodzaju)



Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


51
Natomiast w przypadku gdy wnioskujemy w oparciu o redni z czteroelementowej prby z :

"H_0 = =normal(x;5;1)" ; "H_1 = Normal(x;7;1)"
0,00 4,00 6,28 10,00 14,00
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
alfa = 0,1
beta (prawd. bdu II rodzaju)



Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


52
WYBRANE TESTY STATYSTYCZNE
TEST DLA WARTOCI OCZEKIWANEJ 1
Badamy pewn populacj ze wzgldu na cech statystyczn o ktrej zakadamy, e jest
zmienna losow o rozkadzie , nie znamy ale znamy odchylenie standardowe .
Zamierzamy zweryfikowad ukad hipotez:
vs.
( ; ) na poziomie istotnoci



Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


53
Postpowanie:
Z populacji pobieramy elementow prb, obliczamy redni arytmetyczn z prby
Przy zaoeniu prawdziwoci hipotezy zerowej statystyka testowa:
ma rozkad .






Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


54
W tablicach rozkadu szukamy liczby speniajcej warunek: .
Konstruujemy zbir krytyczny postaci . Jeeli wartod statsystyki
testowej obliczona z naszej prby wpadnie do zbioru krytycznego to odrzucamy. Jaka
bdzie postad zbioru krytycznego w przypadku hipotez oraz .







Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


55
TEST DLA WARTOCI OCZEKIWANEJ 2
Badamy pewn populacj ze wzgldu na cech statystyczn o ktrej zakadamy, e jest
zmienna losow o rozkadzie , nie znamy wartoci oczekiwanej ani odchylenia
standardowego . Zamierzamy zweryfikowad ukad hipotez:
vs.
( ; ) na poziomie istotnoci




Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


56
Postpowanie:
Z populacji pobieramy elementow prb, obliczamy redni arytmetyczn z prby i
odchylenie standardowe .
Przy zaoeniu prawdziwoci hipotezy zerowej statystyka testowa:
ma rozkad - Studenta o stopniach swobody





Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


57
W tablicach rozkadu Studenta o stopniach swobody szukamy liczby speniajcej
warunek: . Konstruujemy zbir krytyczny postaci .
Jeeli wartod statsystyki testowej obliczona z naszej prby wpadnie do zbioru krytycznego
to odrzucamy. Jaka bdzie postad zbioru krytycznego w przypadku hipotez oraz .







Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


58
TEST RWNOCI WARTOCI OCZEKIWANYCH W DWCH POPULACJACH
Badamy dwie populacje oraz , nie znamy odchyleo standartowych
w populacjach ale zakadamy, e ma miejsce . Zamierzamy zweryfikowad uklad hipotez:
vs.
( ; ) na poziomie istotnoci






Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


59
Z populacji pobieramy elementow prb
Z populacji pobieramy elementow prb
Obliczamy: , , ,
Przy zaoeniu prawdziwoci hipotezy zerowej statystyka testowa:

ma rozkad - Studenta o stopniach swobody.




Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


60
W tablicach rozkadu Studenta o stopniach swobody szukamy liczby
speniajcej warunek: . Konstruujemy zbir krytyczny postaci
. Jeeli wartod statsystyki testowej obliczona z naszej prby
wpadnie do zbioru krytycznego to odrzucamy. Jaka bdzie postad zbioru krytycznego w
przypadku hipotez oraz .






Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


61
Test zgodnoci
Interesujca nas cecha w populacji ma rozkad prawdopodobieostwa o nieznanej
dystrybuancie . Zamierzamy zweryfikowad hipotez zerow goszc, e nieznan
dystrybuant jest pewna ustalona dystrybuanta (dystrybuanta teoretyczna):
vs. ; na ustalonym poziomie istotnoci






Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


62
Dzielimy cay zbir liczb rzeczywistych na rozcznych przedziaw za pomoc liczb

tzn.:
Niech oznacza prawdopodobieostwo, e zmienna losowa przyjmie wartod z przedziau
jeeli zmienna ma rozkad wyznaczony dystrybuant (prawdziw jest ), niech .






Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


63
W takiej sytuacji liczba jest oczekiwan liczb obserwacji w elementowej prbie, ktre
przyjmuj wartod (wpadaj do) przedziau .








Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


64
Postpowanie:
Z populacji pobieramy elementow prb losow.
Niech oznacza liczb obserwacji w prbie, ktre przyjmuj wartoci z przedzialu . K.
Pearson udowodni, e statystyka:

Przy zaoeniu prawdziwoci hipotezy zerowej ma rozkad o stopniach swobody, gdy
.



Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


65
Dzielimy zakres wartoci jakie moe przyjmowad zmienna losowa na rozcznych
przedzialw, zliczmy ile obserwacji prby przyjmuje wartosci z tego przedziau. Obliczamy
wartod statystyki testowej .
Dla ustalonego poziomu istotnoci w oparciu o tablice rozkadu o stopniach
swobody wyznaczmy zbir krytyczny postaci , gdzie wartod krytyczna wyznaczana
jest z warunku .
Jeeli wartod statystyki testowej wpadnie do zbioru krytycznego hipotez zerow
odrzucamy.



Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


66
Przykad: Przyrost naturalny w powiatach RP w roku 2000



Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


67
Zmienna: PRZYROST NATURALNY, Rozkad: Jednostajny
Chi-Square test = 133,44, df = 16, p = 0,00000
-9 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8 9 10
Category (upper limits)
0
5
10
15
20
25
30
35
40
N
o
.

o
f

o
b
s
e
r
v
a
t
i
o
n
s





Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


68
Test niezalenoci
Badamy pewn populacj ze wzgldu na dwuwymiarow cech statystyczn , o ktrej
zakadamy, e jest dwuwymiarow zmienna losow o nieznanym rozkadzie. Zamierzamy
zweryfikowac hipoteze zerow:

vs.





Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


69
Postpowanie:
Niech cecha przyjmuje wartoci ,
Niech cecha przyjmuje wartoci .







Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


70
Z populacji pobieramy - elementowa prb, dane zestawiamy w postaci nastepujacej tabeli:
X
Y













Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


71
Gdzie symbol oznacza liczb elementw prby ktre maj wartod co do cechy oraz
wartod co do cechy . Symbol oznacza tzw. liczno brzegow dla wartoci - ile
elementw w prbie przyjo wartod bez wzgldu na to jak przyjeo wartod co do cechy .
Zachodz przy tym rwnoci:







Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


72
Jeeli hipoteza , e cechy i s niezalene, jest prawdziwa, to statystyka:
,
ma, gdy , rozkad o stopniach swobody.







Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


73
Ustalamy poziom istotnoci , z tablic rozkadu o odczytujemy wartod
speniajc warunek . Konstruujemy zbir krytyczny postaci - jeeli
wartod statsystyki z prby wpadnie do zbioru krytycznego, to odrzucamy.







Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


74
Przykad:
Istnieje powszechne przekonanie, e biega znajomod jzykw obcych istotnie zwiksza szanse
na znalezienie dobrze patnej pracy. W celu zweryfikowania przekonania w lutym 2005 roku
wylosowano 1000 dorosych mieszkaocw wojewdztwa maopolskiego i zapytano ich o
wielkod dochodu uzyskanego w roku 2004 oraz o bieg znajomod co najmniej jednego jzyka
obcego. Rezultaty badania zestawiono w poniszej tabeli:





Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


75

DOCHD PRZED OPODATKOWANIEM W ROKU 2004
Poniej redniej krajowej Powyej redniej krajowej
Wada biegle co najmniej jednym
jzykiem obcym
100 50
Nie wada biegle jzykiem obcym 500 350

W oparciu o dane zawarte w tabeli zweryfikowad powszechne przekonanie. Przyjd poziom
istotnoci rwny 5%.



Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


76







Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


77
Uwagi na temat odpornoci testu statystycznego
Procedur wyboru waciwego modelu stochastycznego, w kategoriach ktrego rozpatruje si
zaobserwowane dane okrela si jako specyfikacj modelu. Na og pocztkowo wybiera si tzw.
oglny model roboczy w oparciu o obserwacje szacuje si szczegln posta modelu (kryterium
dobroci oszacowania odnosi si do oglnego modelu roboczego). Mona tu popeni tzw. bd
specyfikacji w przypadku gdy oglny model roboczy nie zawiera prawdziwego modelu
stochastycznego generujcego dane.







Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


78

W praktyce wybr modelu stochastycznego poprzedzony jest odpowiedziami na pytania:
- w jaki sposb pozyskiwane s dane?
- na ile dane obarczone s bdami pomiaru i zapisu?
- co jest populacj, o ktrej informuj dane?
- czy dysponujemy uyteczn informacj a priori o badanym zjawisku lub o naturze
zaobserwowanych danych?








Wnioskowanie Statystyczne D. Kosiorowski 2007/2008


79
Mwic o odpornoci procedury statystycznej bardzo czsto za punkt odniesienia przyjmuje si myl
Boxa i Andersena Uyteczne w badaniach testy statystyczne to takie, ktre: 1) s wraliwe na
zmiany tych wielkoci, ktrych dotycz weryfikowane hipotezy, 2) nieczue na zmiany tych
wielkoci, ktre w danym problemie graj rol czynnikw pobocznych. Test speniajcy pierwszy
postulat nazywa si mocnym, test speniajcy drugi postulat bdziemy nazywamy odpornym.
Okrelenie odporny (ang.: robust) stosuje si do procedur statystycznych, zwaszcza testw
statystycznych oraz do statystyk, na ktrych si te metody opieraj.