Vous êtes sur la page 1sur 50

Statistics for

Business and Economics


6th Edition

Chapter 7

Sampling and
Sampling Distributions
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-1
Chapter Goals
After completing this chapter, you should be able to:
 Describe a simple random sample and why sampling is
important
 Explain the difference between descriptive and inferential
statistics
 Define the concept of a sampling distribution
 Determine the mean and standard deviation for the
sampling distribution of the sample mean,
X
 Describe the Central Limit Theorem and its importance
 Determine the mean and standard deviation for the
sampling distribution of the sample proportion,

 Describe sampling distributions of sample variances

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-2
Tools of Business Statistics

 Descriptive statistics
 Collecting, presenting, and describing data

 Inferential statistics
 Drawing conclusions and/or making decisions
concerning a population based only on
sample data

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-3
Populations and Samples

 A Population is the set of all items or individuals


of interest
 Examples: All likely voters in the next election
All parts produced today
All sales receipts for November

 A Sample is a subset of the population


 Examples: 1000 voters selected at random for interview
A few parts selected for destructive testing
Random receipts selected for audit

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-4
Population vs. Sample

Population Sample

a b cd b c
ef gh i jk l m n gi n
o p q rs t u v w o r u
x y z y

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-5
Why Sample?

 Less time consuming than a census

 Less costly to administer than a census

 It is possible to obtain statistical results of a


sufficiently high precision based on samples.

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-6
Simple Random Samples

 Every object in the population has an equal chance of


being selected
 Objects are selected independently
 Samples can be obtained from a table of random
numbers or computer random number generators

 A simple random sample is the ideal against which


other sample methods are compared

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-7
Suy diễn thống kê

 Trình bày quan điểm về đặc tính của tổng thể dựa
trên kết quả phân tích đặc tính của mẫu
Số thống kê mẫu Tham số tổng thể
(biết) suy diễn (không biết, nhưng có thể
ước lượng bằng mẫu)

Sample Population

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-8
Suy diễn thống kê
Rút ra kết luận hoặc ra quyết định về tổng thể dựa
vào kết quả mẫu
 Ước lượng
 Ví dụ: ước lượng trung bình trọng
lượng tổng thể bằng trung bình
trọng lượng mẫu
 Kiểm định giả thuyết
 Ví dụ: dùng chứng cứ thu thập
được từ mẫu để kiểm định lời tuyên
bố rằng trung bình trọng lượng tổng
thể là 120kg
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-9
Phân phối chọn mẫu

 Phân phối chọn mẫu là phân phối của


tất cả các giá trị số thống kê có thể
nhận với 1 mẫu có kích thước nhất định
rút ra từ tổng thể

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-10
Chapter Outline

Sampling
Distributions

Sampling Sampling
Distribution of Distribution of
Sample Sample
Mean Proportion

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-11
Phân phối chọn mẫu của
Trung bình mẫu

Sampling
Distributions

Sampling Sampling
Distribution of Distribution of
Sample Sample
Mean Proportion

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-12
Tạo phân phối chọn mẫu

 Giả sử có 1 tổng thể như sau…


C D
 Kích thước tổng thể N=4 A B
 Biến ngẫu nhiên X là tuổi
của các cá nhân trong tổng thể
 Giá trị của X:
18, 20, 22, 24 (tuổi)

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-13
Tạo phân phối chọn mẫu
(continued)

Các số đo tổng hợp cho phân phối tổng thể:

μ=
∑ X i P(x)
N
.25
18 + 20 + 22 + 24
= = 21
4
0
σ=
∑ (X − μ) i
2

= 2.236
18 20 22 24 x
N A B C D
phân phối đều

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-14
Tạo phân phối chọn mẫu
(continued)
Xét tất cả các mẫu có kích thước n = 2

st
1
16 trung bình
mẫu
1st 2nd Observation
Obs 18 20 22 24
18 18 19 20 21
20 19 20 21 22

Obs 18
16 mẫu có thể rút ra
từ tổng thể(lấy mẫu 22 20 21 22 23
có hoàn lại)
24 21 22 23 24

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-15
Tạo phân phối chọn mẫu
(continued)

Phân phối chọn mẫu của trung bình mẫu

16 trung bình mẫu Phân phối


trung bình mẫu
1st 2nd Observation _
Obs 18 20 22 24 P(X)
.3
18 18 19 20 21
.2
20 19 20 21 22
.1
22 20 21 22 23
0 _
24 21 22 23 24 18 19 20 21 22 23 24 X
(không còn là pp đều )
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-16
Tạo phân phối chọn mẫu
(continued)

Các số đo tổng hợp cho phân phối chọn mẫu này

E(X) =
∑ X i
=
18 + 19 + 21+  + 24
= 21 = μ
N 16

σX =
∑ ( X i − μ) 2

N
(18 - 21)2 + (19 - 21)2 +  + (24 - 21)2
= = 1.58
16

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-17
So sánh pp tổng thể với pp mẫu
Tổng thể N = 4 Trung bình mẫu
n=2

μ = 21 σ = 2.236 μX = 21 σ X = 1.58
_
P(X) P(X)
.3 .3

.2 .2

.1 .1

0 X 0 18 19 20 21 22 23 24
_
18 20 22 24 X
A B C D
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-18
Giá trị kỳ vọng của trung bình mẫu

 Coi X1, X2, . . . Xn tượng trưng cho một ngẫu nhiên rút từ
tổng thể

 Giá trị trung bình mẫu của các giá trị quan sát được
được định nghĩa là
1 n
X = ∑ Xi
n i=1

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-19
Sai số chuẩn của số trung bình

 Các mẫu khác nhau (nhưng cùng kích thước) rút từ 1


tổng thể sẽ cho các giá trị trung bình khác nhau
 Số đo khuynh hướng thay đổi của số trung bình từ mẫu
này sang mẫu khác là Sai số chuẩn của số trung bình

σ
σX =
n
 Sai số chuẩn của số trung bình giảm khi kích thước mẫu
gia tăng

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-20
Nếu tổng thể thường

 Nếu tổng thể theo phân phối thường với 2 tham


số μ và σ, phân phối chọn mẫu của X cũng sẽ
là thường với 2 số thống kê

σ
μ X =μ and σX =
n

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-21
Giá trị Z cho phân phối chọn mẫu

 Giá trị Z cho phân phối chọn mẫu của X

( X − μ) ( X − μ)
Z= =
σX σ
n

where: X = sample mean


μ = population mean
σ = population standard deviation
n = sample size

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-22
Thừa số điều chỉnh
tổng thể hữu hạn
 Áp dụng thừa số điều chỉnh tổng thể hữu hạn nếu
 1 phần tử trong tổng thể không thể được chọn
nhiều hơn 1 lần trong 1 mẫu (lấy mẫu không hoàn
lại)
 kích thước mẫu lớn hơn 5% tổng thể
khi đó :

or
s N- n 2
σ N −n
V(X) = σX =
n N- 1 n N −1

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-23
Thừa số điều chỉnh
tổng thể hữu hạn
 khi kích thước mẫu lớn hơn 5% tổng thể

( X − μ)
Z=
σ N −n
n N −1

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-24
Tính chất phân phối chọn mẫu

Normal Population


μx = μ Distribution

μ x
(i.e. x không chệch ) Normal Sampling
Distribution
(has the same mean)

μx
x
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-25
Tính chất phân phối chọn mẫu
(continued)

 Lấy mẫu có hoàn lại


khi n tăng Mẫu lớn hơn
σ x giảm

Mẫu nhỏ hơn

μ x
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-26
Khi tổng thể không theo
pp thường

 Áp dụng Định lý giới hạn trung tâm:


 Kể cả khi tổng thể không theo pp thường ,

 …pp của trung bình mẫu của tổng thể vẫn tương đương

pp thường nếu kích thước mẫu đủ lớn

Properties of the sampling distribution:


σ
μx = μ σx =
and
n
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-27
Định lý giới hạn trung tâm

the sampling
As the n↑
distribution
sample
becomes
size gets
almost normal
large
regardless of
enough…
shape of
population

x
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-28
If the Population is not Normal
(continued)

Population Distribution
Sampling distribution
properties:
Central Tendency
μx = μ
μ x
Variation Sampling Distribution
σ (becomes normal as n increases)
σx = Larger
n Smaller
sample size
sample
size

μx x
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-29
How Large is Large Enough?

 For most distributions, n > 25 will give a


sampling distribution that is nearly normal
 For normal population distributions, the
sampling distribution of the mean is always
normally distributed

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-30
Ví dụ

 Tổng thể: μ = 8 , σ = 3. Chọn mẫu ngẫu nhiên


kích thước n = 36.

 Xác suất trung bình mẫu giữa 7.8 và 8.2 là bao


nhiêu?

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-31
Ví dụ
(continued)

Solution:
 Even if the population is not normally distributed,
the central limit theorem can be used (n > 25)
 … so the sampling distribution of is
approximately normal x
 … with mean = 8
 …and standard μ
deviation
x
σ 3
σx = = = 0.5
n 36
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-32
Example
(continued)
Solution (continued):

æ ö
ç 7.8 - 8 s X -s 8.2 - 8 ÷
P(7.8 < s < 8.2) = P < <
X ç3 s 3 ÷
è 36 n 36 ø
= P(-0.4 < Z < 0.4 )

Population Sampling Standard Normal


Distribution Distribution Distribution .1915
??? +.1915
? ??
? ? Sample Standardize
? ? ?
?
7.8 8.2 -0.4 04
μ=8 X μX = 8 x μz = 0 Z

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-33
Khoảng tin cậy
 Goal: Xác định khoảng giá trị nhiều khả năng chứa
đựng trung bình mẫu, khi biết trung bình và phương sai
tổng
 By the Central Limit Theorem, we know that the distribution of X
is approximately normal if n is large enough, with mean μ and
standard deviation σ X
 Coi zα/2 là giá trị z sao phần đuôi phải của pp thường có diện tích
bằng α/2 (i.e., khoảng giá trị - zα/2 đến zα/2 có xác suất 1 – α)
 Thì
μ ± zα/2 σ X

là khoảng chứa X với xác suất1 – α


Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-34
Sampling Distributions of
Sample Proportions

Sampling
Distributions

Sampling Sampling
Distribution of Distribution of
Sample Sample
Mean Proportion

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-35
Tỷ lệ tổng thể, P
P = tỷ lệ tổng thể có đặc tính ta quan tâm

Tỷ lệ mẫu ( ) cho ta ước lượng P


Pö= 0 ≤= ≤ 1
X number of items in the sample having the characteristic of interest
n sample size
 0≤ ≤1

 tuân theo pp nhị thức, nhưng xấp xỉ thường khi nP(1 –
P)P̂> 9

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-36
^
Phân phối chọn mẫu của P
 Tính xấp xỉ bằng pp thường
Sampling Distribution
P(Pˆ )
.3
.2
.1
0
0 .2 .4 .6 8 1 P̂

Tính chất:
æX ö P(1- P)
E(Pˆ ) = p σ = Vç ÷=
2
and Pö
ènø n
(where P = population proportion)

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-37
Giá trị Z cho tỷ lệ

Chuẩn hóa P̂ thành Z với công thức:

Pˆ − P Pˆ − P
Z= =
σ Pˆ P(1− P)
n

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-38
Ví dụ

 Nêu tổng thể người đi bầu cử ủng hộ Ông A là


P = 0.4, xác suất mẫu cỡ 200 cho kết quả giữa
0w4 và 0.45 là?

 i.e.: if P = .4 and n = 200, what is


P(.40 ≤ P̂ ≤ .45) ?

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-39
Ví dụ
(continued)

 if P = .4 and n = 200, what is


P(.40 ≤ P̂ ≤ .45) ?

P(1− P) .4(1− .4)


Tìm σ Pˆ : σ Pˆ = = = .03464
n 200

Chuyển  .40 − .40 .45 − .40 


sang pp
ˆ
P(.40 ≤ P ≤ .45) = P ≤Z≤ 
thường  .03464 .03464 
chuẩn: = P(0 ≤ Z ≤ 1.44)

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-40
Ví dụ
(continued)

 if p = .4 and n = 200, what is


P(.40 ≤ P̂ ≤ .45) ?

dùng Bảng thường chuẩn: P(0 ≤ Z ≤ 1.44) = .4251

Standardized
Sampling Distribution Normal Distribution

.4251

Standardize

.40 .45 P̂ 0 1.44


Z

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-41
Sampling Distributions of
Sample Proportions

Sampling
Distributions

Sampling Sampling Sampling


Distribution of Distribution of Distribution of
Sample Sample Sample
Mean Proportion Variance

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-42
Sample Variance
 Let x1, x2, . . . , xn be a random sample from a
population. The sample variance is
n
1
s2 = ∑
n − 1 i=1
(x i − x) 2

 the square root of the sample variance is called


the sample standard deviation

 the sample variance is different for different


random samples from the same population
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-43
Sampling Distribution of
Sample Variances

 The sampling distribution of s2 has mean σ2


E(s2 ) = σ 2
 If the population distribution is normal, then
4

Var(s2 ) =
n −1
 If the population distribution is normal then
(n - 1)s 2
σ2
has a χ 2
distribution with n – 1 degrees of freedom

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-44
The Chi-square Distribution
 The chi-square distribution is a family of distributions,
depending on degrees of freedom:
 d.f. = n – 1

0 4 8 12 16 20 24 28 χ 0 4 8 12 16 20 24 28 χ 0 4 8 12 16 20 24 28 χ
2 2 2

d.f. = 1 d.f. = 5 d.f. = 15


 Text Table 7 contains chi-square probabilities

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-45
Degrees of Freedom (df)
Idea: Number of observations that are free to vary
after sample mean has been calculated

Example: Suppose the mean of 3 numbers is 8.0

Let X1 = 7 If the mean of these three


Let X2 = 8 values is 8.0,
What is X3? then X3 must be 9
(i.e., X3 is not free to vary)
Here, n = 3, so degrees of freedom = n – 1 = 3 – 1 = 2
(2 values can be any numbers, but the third is not free to vary
for a given mean)
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-46
Chi-square Example
 A commercial freezer must hold a selected
temperature with little variation. Specifications call
for a standard deviation of no more than 4 degrees
(a variance of 16 degrees2).
 A sample of 14 freezers is to be
tested
 What is the upper limit (K) for the
sample variance such that the
probability of exceeding this limit,
given that the population standard
deviation is 4, is less than 0.05?
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-47
Finding the Chi-square Value

(n − 1)s 2
Is chi-square distributed with (n – 1) = 13
χ2 =
σ2 degrees of freedom

 Use the the chi-square distribution with area 0.05


in the upper tail:

χ 2
1 = 22.36 (α = .05 and 14 – 1 = 13 d.f.)
3
probability
α = .05

χ 2

χ 2
1= 22.36
Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-48
Chi-square Example
(continued)
χ 2
1 = 22.36 (α = .05 and 14 – 1 = 13 d.f.)
3
 (n − 1)s 2 2 
So: 
P(s > K) = P
2
> χ13  = 0.05
 16 
(n − 1)K
or = 22.36 (where n = 14)
16

(22.36)(16)
so K= = 27.52
(14 − 1)

If s2 from the sample of size n = 14 is greater than 27.52, there is


strong evidence to suggest the population variance exceeds 16.

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-49
Chapter Summary
 Introduced sampling distributions
 Described the sampling distribution of sample means
 For normal populations
 Using the Central Limit Theorem
 Described the sampling distribution of sample
proportions
 Introduced the chi-square distribution
 Examined sampling distributions for sample variances
 Calculated probabilities using sampling distributions

Statistics for Business and Economics, 6e © 2007 Pearson Education, Inc. Chap 7-50

Vous aimerez peut-être aussi