Vous êtes sur la page 1sur 21

Statystyka matematyczna wykad 2

Podstawowe rozkady statystyk z prby.


wprowadzenie do teorii estymacji;
przykad numeryczny;
podstawowe rozkady zmiennej losowej cigej rozkad normalny;
tablice statystyczne:
rozkadu normalnego standaryzowanego N(0;1);
T-Studenta;
2;
rozkady statystyk z prby;
Wprowadzenie do teorii estymacji.
Estymacja to wnioskowanie o wartociach nieznanych wielkoci
charakteryzujcych populacj generaln na podstawie prby losowej.
ESTYMACJA PARAMETRYCZNA
punktowa (za ocen wartoci parametru przyjmuje si jedn konkretn
warto);
przedziaowa (wyznacza si przedzia liczbowy, ktry z pewnym
prawdopodobiestwem zawiera warto szacowanego parametru);
ESTYMATOR (STATYSTYKA Z PRBY)
Estymatorem T
n
parametru rozkadu populacji generalnej
nazywamy funkcj z prby T
n
= t(X
1
, X
2
, ... , X
n
), ktra suy do
oszacowania wartoci parametru .
Warto przyjt przez estymator, gdy podstawimy do funkcji okrelony
ukad obserwacji nazywamy ocen - realizacj zmiennej losowej T
n
rnic pomidzy estymatorem a wartoci parametru T
n
- =
nazywamy bdem szacunku
bd szacunku jest zmienn losow, ktrej miar jest :
A=E
(
T
n
0
)
2
jeeli estymator jest nieobciony E(T
n
) = wwczas:
A=E
(
T
n
E
(
T
n
))
2
=D
2
(
T
n
)
jest wariancj estymatora
odchylenie standardowe D(T
n
) nazywamy standardowym bdem
szacunku parametru
wyraenie
D
(
T
n
)
O
nazywane jest wzgldnym bdem szacunku
PODSTAWOWE WASNOCI ESTYMATORW:
nieobciono
E
(
T
n
)
=O

E
(
T
n
)
O=b
(
T
n
) obcienie estymatora
lim
n-
b
(
T
n
)
=0
asymptotyczna nieobciono
zgodno
lim
n-
PT
n
Oc=1
dla dowolnego c>0
efektywno
O efektywnoci estymatora decyduje jego wariancja. Pord
wszystkich nieobcionych estymatorw parametru , ten o najmniejszej
wariancji nazwiemy najefektywniejszym
D
2
( T
n
*
)D
2
(T
n
i
)
Efektywnoci estymatora T
n
nazwiemy wyraenie:
e
(
T
n
*
)
=
D
2
(T
n
*
)
D
2
(T
n
i
)

e( T
n
*
)=1 jeeli D
2
( T
n
*
)=D
2
(T
n
i
)
0e( T
n
*
)1 w pozostaych przypadkach.
dostateczno
Estymator T
n
parametru jest dostateczny (wystarczajcy), jeeli
zawiera wszystkie informacje, jakie na temat parametru mona
uzyska na podstawie prby i aden inny estymator nie umoliwia
otrzymania dodatkowych informacji o szacowanym parametrze.
Przykad numeryczny. - [plik los.xls ]
Rozkad powierzchni mieszka zamieszkanych przez badanych studentw na podstawie 10 prb
-0,5
0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
37,5 40 42,5 45 47,5 50 52,5 55 57,5 60 62,5 65 67,5 70 72,5 75 77,5 80 82,5 85
rednia powierzchnia z prby
l
i
c
z
b
a

p
r

b
Rozkad powierzchni mieszka zamieszkanych przez badanych studentw na podstawie 100 prb
-5
0
5
10
15
20
25
30
35
37,5 40 42,5 45 47,5 50 52,5 55 57,5 60 62,5 65 67,5 70 72,5 75 77,5 80 82,5 85
rednia powierzchnia z prby
l
i
c
z
b
a

p
r

b
Rozkad powierzchni mieszka zamieszkanych przez badanych studentw na podstawie 1000 prb
-50
0
50
100
150
200
250
300
37,5 40 42,5 45 47,5 50 52,5 55 57,5 60 62,5 65 67,5 70 72,5 75 77,5 80 82,5 85
rednia powierzchnia z prby
l
i
c
z
b
a

p
r

b
Rozkad powierzchni mieszka zamieszkanych przez badanych studentw na podstawie 10 000
prb
0
100
200
300
400
500
600
700
800
36,5 38 39,5 41 42,5 44 45,5 47 48,5 50 51,5 53 54,5 56 57,5 59 60,5 62 63,5 65
rednia powierzchnia z prby
l
i
c
z
b
a

p
r

b
Podstawowe rozkady zmiennej losowej cigej;
Rozkad normalny
Abraham de Moivre (1667 1754) otrzyma rozkad normalny jako
graniczn posta rozkadu dwumianowego,
Pierre Simon Laplace (1749 1827),
Karl Friedrich Gauss (1777 1855)
Zmienna losowa X ma rozkad normalny z parametrami : oraz ,
co zapisuje si jako X: N(, ) , jeli jej funkcja gstoci wyraa si
wzorem :
f ( x)=
1
c
.
2n
e
( xj)
2
2c
2
gdzie: x oraz c>0
oraz:
= E(X) - jest wartoci oczekiwan
= D(X) - odchylenie standardowe
= 3.14159
Wasnoci krzywej normalnej:
- jest symetryczna wzgldem prostej x= (symetryczno);
- osiga maksimum rwne
1
c
.
2n
dla x= (jednomodalno);
- jej ramiona maj punkty przegicia dla x= oraz x=+ (zmienno);
Z wasnoci pierwszej wynika, e decyduje o pooeniu krzywej
wzgldem osi OX. Natomiast z wasnoci drugiej i trzeciej wynika, e
parametr okrela smuko krzywej.
- dwa parametry : i cakowicie okrelaj funkcj gstoci rozkadu
normalnego (okrelono).
Dystrybuanta rozkadu normalnego ma posta :

F ( x)=
1
c
.
2n

x
e
( xj)
2
2c
2
dx
Dystrybuanta F(X) oznacza wic prawdopodobiestwo takiego
zdarzenia, e zmienna losowa X przyjmie wartoci nie wiksze od
pewnego zaoonego poziomu x
W przypadku krzywej normalnej obliczanie prawdopodobiestw:
P(a<X<b) dla a<b jest kopotliwe gdy wymaga cakowania funkcji
gstoci w granicach a,b. Std bardzo uyteczna jest moliwo
sprowadzenia dowolnego rozkadu normalnego do postaci tzw.
standaryzowanego rozkadu normalnego.
Standaryzowany rozkad normalny jest niezaleny od wartoci
parametrw: i . Jest to moliwe przy przyjciu zamiast obserwowanej
zmiennej losowej cigej X zmiennej standaryzowanej z:
z=
x
i
j
c
Jeli zmienna losowa X ma rozkad normalny, to zmienna losowa z
ma rwnie rozkad normalny o parametrach: =0 i =1, co zapisujemy
N(0;1).
Funkcja gstoci przyjmuje wwczas posta:
f ( z)=
1
c.2n
e

1
2
z
2
-3 -2,6 -2,2 -1,8 -1,4 -1 -0,6 -0,2 0,2 0,6 1 1,4 1,8 2,2 2,6 3
POLE POD KRZYW
MA POWIERZCHNI
RWN 1
Natomiast funkcja dystrybuanty okrelona jest nastpujco:
F ( z
0
)=
1
c.2n

z
0
e

1
2
z
2
dz
Funkcja gstoci i dystrybuanta standaryzowanego rozkadu normalnego
zostay stablicowane.
Do obliczania prawdopodobiestw dla zmiennej losowej o rozkadzie
normalnym N(,) maj zastosowanie nastpujce zwizki midzy
prawdopodobiestwem a dystrybuant:
1. P axb=P axb=F (b)F (a)=F
s
(
bj
c
)
F
s
(
aj
c
)
2. P xa=Pxa=F(a)=F
s
(
aj
c
)
-3 -2,6 -2,2 -1,8 -1,4 -1 -0,6 -0,2 0,2 0,6 1 1,4 1,8 2,2 2,6 3
z
0
x
3.
P xa=Px>a=1F (a)=1F
s
(
aj
c
)
4.
F
s
(z)=1F
s
( z)
gdzie: F oznacza dystrybuant rozkadu N(,), natomiast
F
s
oznacza dystrybuant rozkadu N(0;1).
W Excelu mamy do wyboru 4 funkcje zwizane z obliczaniem wartoci
dla rozkadu normalnego:
ROZKAD.NORMALNY
ROZKAD.NORMALNY.ODW
ROZKAD.NORMALNY.S
ROZKAD.NORMALNY.S.ODW
Przykad:
Temperatura ciaa ludzkiego jest zmienn losow o rozkadzie
normalnym ze redni wynoszc 36,6C oraz odchyleniem standardowym
=0,4C. Oblicz prawdopodobiestwo zdarzenia, e losowo wybrany
pacjent pewnego szpitala bdzie mia temperatur ciaa:
a) mniejsz ni 36,3C
b) wiksz ni 37,6C
c) wiksz ni 36,5C ale mniejsz ni 37,3C.
ad.a)
Px36,3=F(36,3)=F
s
(
36,336,6
0,4
)
=F
s
(0,75)=0,2266
-3 -2,6 -2,2 -1,8 -1,4 -1 -0,6 -0,2 0,2 0,6 1 1,4 1,8 2,2 2,6 3
-0,75
x
Pole =
0,2266
ad.b)
Px>37,6=1F (37,6)=1F
s
(
37,636,6
0,4
)
=1F
s
(2,5)=10,9938=0,0062
-3 -2,6 -2,2 -1,8 -1,4 -1 -0,6 -0,2 0,2 0,6 1 1,4 1,8 2,2 2,6 3
2,5
x
Pole =
0,0062
ad.c)
P36,5x37,3=F (37,3)F (36,5)=F
s
(
37,336,6
0,4
)
F
s
(
36,536,6
0,4
)
=
=F
s
(1,75)F
s
(0,25)=0,95990,4013=0,5586
-3 -2,6 -2,2 -1,8 -1,4 -1 -0,6 -0,2 0,2 0,6 1 1,4 1,8 2,2 2,6 3
-0,25
x
Pole =
0,5586
1,75
x
T ablice statystyczne
Tablice rozkadu T-Studenta
Tablice rozkadu 2
Rozkady statystyk z prby.
Cecha X ma w populacji rozkad normalny N(,). Z populacji tej
pobieramy n-elementow prb losow prost (X
1
, X
2
, ... , X
n
).
Wwczas rednia arytmetyczna z prby ma (na mocy addytywnoci
rozkadu normalnego) rozkad normalny o parametrach

X ~ N
(
j;
c
.
n
)
. Standaryzujc zmienn losow

X o rozkadzie
normalnym otrzymujemy
z=

xj
c
.
n
=

xj
c
.
n

Cecha X ma rozkad normalny N(,) o nieznanej wartoci parametru .
Wwczas do wnioskowania o redniej wykorzystuje si statystyk:
t =

xj

S
.n
, gdzie:

S=
.

i=1
n
( x
i

x)
2
n1
Rozkad statystyki t jest niezaleny od parametru i nazywany jest
rozkadem t-Studenta. Krzywa gstoci rozkadu t-Studenta jest podobna
do krzywej normalnej, nieco tylko bardziej spaszczona. Przy liczbie
stopni swobody dcej do nieskoczonoci, rozkad t-Studenta jest
zbieny do standardowego rozkadu normalnego. Zbieno jest do
szybka, czsto przy stopniach swobody df >= 30 zastpuje si dokadny
rozkad t-Studenta granicznym rozkadem normalnym.
rednia jedna populacja generalna:
czy znane jest (odchylenie standardowe w caej populacji) ?
TAK NIE
z=

xj
c
.
n
czy prba jest dua (n>=30) ?
TAK NIE
z=

xj
S
.
n t =

xj

S
.
n
lub
t =

xj
S
.
n1
rednie dwie populacje generalne:
czy znane jest
1
i
2
(odchylenia standardowe w obydwu populacjach) ?
TAK NIE
z=

x
1

x
2
.
c
1
2
n
1
+
c
2
2
n
2
czy prba jest dua (n
1
i n
2
>=30) ?
TAK NIE
z=

x
1

x
2
.
S
1
2
n
1
+
S
2
2
n
2
t =

x
1

x
2
.
n
1
S
1
2
+n
2
S
2
2
n
1
+n
2
2
(
1
n
1
+
1
n
2
)
rednie dwie populacje, ale wyniki s skorelowane (tworz pary powizanych wartoci):
t=

d
S
d
.
n1
, gdzie

d=x
1
x
2

d=
1
n

( x
1
x
2
)
S
d
2
=
1
n

(d
i

d)
2
=S
x1
2
+S
x2
2
2cov( x
1
x
2
)
odsetek jedna populacja generalna:
z=
m
n
n
0
.
n
0
(1n
0
)
n
odsetek dwie populacje generalne:
z=
m
1
n
1

m
2
n
2
.

p=
m
1
+m
2
n
1
+n
2

q=1

n=
n
1
n
2
n
1
+n
2