Vous êtes sur la page 1sur 37

Quy trình xử lý dữ liệu

1. Giá trị hóa dữ liệu 3. Nhập dữ liệu vào máy tính 5. Lưu trữ dữ liệu để phân tích
2. Mã hóa các câu trả lời 4. Làm sạch dữ liệu 6. Phân tích dữ liệu

Khi thu thập dữ liệu bằng bảng hỏi, các bảng câu hỏi thu về sẽ cần được kiểm tra
những vấn đề gì về dữ liệu thu được? Đề xuất giải pháp khắc phục với các
trường hợp?
Kiểm tra tính hợp lệ của dữ liệu:
▪ Kiểm tra bảng câu hỏi đã được trả lời: tính đầy đủ của bảng câu hỏi, việc ghi chép câu trả lời…
▪ Kiểm tra tính logic của các câu trả lời
▪ Xem xét những chỉ dẫn về thủ tục phỏng vấn
▪ Kiểm tra tính trung thực của các câu trả lời
Hiệu chỉnh dữ liệu:
▪ Liên hệ trực tiếp phỏng vấn viên để làm sáng tỏ vấn đề: các câu trả lời không đọc được, không rõ ý…
▪ Gặp và phỏng vấn lại đáp viên
▪ Suy luận từ các câu trả lời khác
▪ Loại bỏ toàn bộ bảng câu hỏi và tiến hành phỏng vấn lại
MÃ HÓA: quá trình chuyển đổi các trả lời thành dạng mã số để nhập và xử lý dễ dàng

PHÂN LOẠI DỮ LIỆU


Định tính: Thang đo danh nghĩa, Thang đo thứ bậc
- Phản ánh tính chất, sự hơn kém Định lượng: Thang đo khoảng cách, Thang đo tỷ lệ
- Không tính giá trị trung bình - Phản ánh mức độ, sự hơn kém
- Được thể hiện dưới nhiều cách thức khác nhau. - Tính được giá trị trung bình
VD : - Được thể hiện bằng các con số cụ thể
• Giới tính : Nam – Nữ VD: Tuổi tác, thu nhập, điểm số…
• Kết quả học tập : Giỏi – Khá – Trung bình – Yếu

CÁC LOẠI THANG ĐO


- Thang đo danh nghĩa (Nominal scale) : dùng để phân loại đối tượng (có sẵn đáp án), Có thể sử dụng câu hỏi 1 lựa
chọn (SA) hoặc câu hỏi nhiều lựa chọn (MA)
- Thang đo thứ bậc (ordinal scale): dữ liệu được sắp xếp theo ý muốn về sự hơn thua (Độ tuổi, khoảng thu nhập,
trình độ học vấn, thứ tự quan tâm/ưu tiên/yêu thích…)

1
- Thang đo khoảng (Interval scale or likert): cho biết khoảng cách giữa các thứ bậc (1. ht ko đồng ý, 2. ko đồng ý,
3. trung lập, 4. đồng ý, 5. ht đồng ý)
- Thang đo tỷ lệ (ratio scale): câu hỏi điền thông tin, cho thấy sự hơn kém giữa các dữ liệu

KHAI BÁO BIẾN VÀ NHẬP LIỆU


- Mở một file từ excel: Vào Menu File, Open, Data. Sau đó, vào mục Files of type để chọn loại tập tin cần truy
xuất dữ liệu

*QUY TẮC KHAI BÁO TÊN BIẾN


+Bắt đầu bằng một chữ cái và không bắt đầu bằng dấu chấm(.)
+Không được chứa khoảng trắng và các ký tự đặc biệt như (!),(?),(*)…
+Các từ khóa sau đây không được dùng làm tên biến : ALL,NE,EQ,TO,LE,LT,BY,OR,GT,AND,NOT,GET,WITH

*Nhập giá trị (Cột Value):


Nhấp chuột vào nút … nằm ở phía phải của ô tại dòng của biến đang khai báo, hộp thoại khai báo
Value Labels sẽ xuất hiện :
Value: Nhập các giá trị mã hóa
Label : Nhãn giải thích ý nghĩa của các mã số đã nhập
- Sau khi nhập dữ liệu vào 2 ô trên, nhấn Add để lưu
- Nếu muốn sửa mã đã nhập, ấn Change, hoặc muốn xóa ấn Remove
- Sau khi nhập xong hết nhấn OK

THAY ĐỔI MỘT SỐ THUỘC TÍNH MẶC ĐỊNH CỦA SPSS


a. Hiển thị tên hoặc nhãn biến trong khung chứa biến khi thực hiện các thủ tục xử lý
Chọn Edit -> Options…->General->Display name (hiển thị tên) hoặc Display label (hiển thị nhãn)-> Apply -> OK
b. Thứ tự hiển thị biến trong khung chứa biến khi thực hiện các thủ tục xử lý
Chọn Edit -> Options…->General-> Alphabetical (hiển thị theo thứ tự abc) hoặc File (hiển thị theo thứ tự khai
báo) )-> Apply -> OK
c. Độ rộng và số số lẻ biến kiểu numeric
Edit -> Options...->Data->Thay đổi số trong ô Width (độ rộng) và ô Decimal Places (số số lẻ)->Apply và chọn OK
d. Hiển thị số hoặc chữ trong Data View
Chọn View -> chọn Value Labels (hiển thị chữ)
e. Hiển thị tiếng Việt trong Data View, Variable View
Chọn View -> chọn Font->Sau đó chọn Font, Font style và Size->OK

2
THỦ TỤC COMPUTE: TẠO BIẾN MỚI KHÔNG HOẶC CÓ ĐIỀU KIỆN
Trong quá trình nhập liệu để có thể rút ngắn thời gian nhập liệu hoặc để phục vụ mục đích phân tích, chúng ta còn
có thể tạo ra biến mới từ các dữ kiện và cấu trúc của biến đã nhập
+Nhấn Transform/Compute
+Trong ô Target variable nhập biến mới trong đó chúng ta cần phải định nghĩa Type&Label để tiện cho việcquản
lý và so sánh các giá trị sau này
+Trong ô Numeric Expression nhập giá trị cần gán cho biến mới từ biến đích cho trước
Tạo biến mới không hoặc có điều kiện
Nếu biến mới không có điều kiện gì thì chương trình mặc định là Include all cases
Nếu biến mới kèm theo điều kiện. Nhấn If/If case satisfies condition sau đó ghi điều kiện ở ô trắng ngay phía dưới

GOM BIẾN: RECODE


-Áp dụng khi :
+Giảm số lượng biểu hiện của 1 biến định tính xuống còn 2-3 biểu hiện
+Biến một biến định lượng thành một biến định tính
-Recode into same variables :
+Recode trên cùng một biến, tức là định lại những giá trị của những biến hiện tại hoặc rút ngắn bớt dãy các giá trị
tồn tại thành những giá trị mới trên cùng những biến đó
Nhấn Transform->Recode into same variable
Chuyển các biến cần định lại sang hộp thoại Variables
Nhấn Old and new values để định lại các giá trị cần thay đổi
Nhấn If để xác định điều kiện thực hiện Recode
Hộp thoại Old and New values:
+Old value : Khai báo giá trị cũ cần chuyển đổi
+New value : dùng khai báo giá trị mới sẽ thay thế cho giá trị cũ tương ứng
+Nhấn Add để lưu
+Nhấn Change nếu thay đổi
+Nhấn Remove nếu muốn loại bỏ thay đổi
+Nếu việc định lại giá trị có các điều kiện kèm theo ta dùng công cụ If
-Recode into different variables :
-Trong trường hợp tạo một biến mới với các giá trị mã hóa do bạn khai báo trên cơ sở biến gốc, còn biến cũ làm cơ
sở mã hóa vẫn được giữ lại
Nhấn Transform/Recode Into Different Variables
Đưa biến cần mã hoá lại từ khung chứa bộ biến sang khung Numeric Variable -> Output Variable.
3
Tại khung Output Variable, khai báo tên và nhãn cho biến mới-> Click chọn Change để thực hiện thay biến.
Tiếp tục thay đổi giá trị của biến bằng cách click chọn Old and New Values…, mở hộp thoại sau:

Ta lần lượt khai báo giá trị cũ bên tay trái (Old Value) thành giá trị mới bên tay phải (New Value) ->Click chọn
Add sau mỗi lần khai báo. Với giá trị cũ có các dạng sau đây:
+Value: từng giá trị cũ rời rạc
+System-missing: giá trị khuyết hệ thống
+System or user missing: giá trị khuyết của hệ thống hoặc do người sử dụng định nghĩa
+Range: một khoảng giá trị (từ … đến … / range: … through: …)
+Range, LOWEST through value: một khoảng giá trị từ giá trị nhỏ nhất đến một giá trị được nhập vào
+Range, value through HIGHEST: một khoảng giá trị từ giá trị nhập vào đến giá trị lớn nhất
Chọn Continue trở về hộp thoại trước, và chọn OK để hoàn tất kệnh.
Khai báo value cho biến vừa tạo tại ô Value của cửa sổ Variable View như hình sau:

4
Tiếp tục thực hiện các phép thống kê mô tả hay kiểm định dựa trên biến mới vừa tạo nhằm phục vụ cho mục tiêu
nghiên cứu.

THỐNG KÊ MÔ TẢ
1. Bảng phân bố tần số 3. Tạo bảng kết hợp nhiều biến
2. Tính đại lượng thống kê mô tả 4. Xử lý câu hỏi nhiều lựa chọn
1. Bảng phân bố tần suất
Bảng phân phối tần suất được thể hiện với tất cả các biến định tính (rời rạc) với các thang đo định danh, thứ bậc và
các biến định lượng (liên tục) với thang đo khoảng cách hoặc tỉ lệ. (likert)
B1: Analyze / Descriptive Statistics / Frequencies…
B2: Chọn biến muốn tính tần số bằng cách click chuột vào tên biến rồi đưa sang khung Variable(s).
B3: Click Ok. Trường hợp muốn vẽ biểu đồ thực hiện thêm bước 4 trước khi click Ok.
B4: Để vẽ biểu đồ click chuột vào ô Charts…. Chọn dạng biểu đồ ở Chart type, chọn giá trị thể hiện trên biểu đồ là
số đếm (frequencies) hay phần trăm (percentages). Click Continue để trở lại hộp thoại Frequencies-> Ok để thực
hiện lệnh.
2. Mô tả dữ liệu (Descriptive)
Sử dụng Analyze / Descriptive Statistics /Descriptives để mở hộp thoại mô tả thống kê
Chỉ cho phép thao tác trên dạng dữ liệu định lượng (thang đo khoảng và tỷ lệ).
Được dùng để thể hiện xu hướng tập trung của dữ liệu (central tendency) thông qua giá trị trung bình của các giá trị
trong biến (mean), và mô tả sự phân tán của dữ liệu thông qua phương sai và độ lệch chuẩn.
B1: Vào menu Analyze-> Descriptive Statistics-> Descriptives…, xuất hiện hộp thoại
B2: Chọn 1 hay nhiều biến (định lượng) muốn tính điểm trung bình đưa vào khung Variable(s).
B3: Click vào ô Options… để xuất hiện hộp thoại Descriptive Options. Chọn các đại lượng thống kê muốn tính
toán bằng cách click vào ô vuông cần thiết (giá trị trung bình, giá trị tối thiểu, giá trị tối đa, phương sai và độ lệch
chuẩn…)
5
+ mean: trung bình; median: trung vị
+ mode: tần suất hay xuất hiện hay còn gọi là tỷ lệ; sum: tổng
+ min, max
+ std: độ lệch chuẩn, var: phương sai
+ SE mean: sai số trung bình
+ display frequency table: để hiện thị bảng tần số của từng yếu tố
B4: Chọn cách sắp xếp kết quả tính toán theo thứ tự danh sách biến (Variable list), thứ tự Alphabetic của nhãn
biến, thứ tự tăng dần (Ascending list), và thứ tự giảm dần (Descending list).
B5: Click Continue để trở về hộp thoại Descriptive->Ok để thực hiện lệnh.
3. Lập bảng cho biến nhiều trả lời
Trong câu hỏi nhiều trả lời sẽ bao gồm nhiều biến chứa đựng các trả lời có thể có, những biến này gọi là biến sơ
cấp. Do đó để xử lý, chúng ta phải gộp các biến sơ cấp này thành một biến gộp chứa các biến sơ cấp
Chọn menu Data/Define Multiple Response Sets
Chọn tất cả những biến sơ cấp liên quan đến một câu hỏi nhiều trả lời ở hộp thoại Set Definition bên trái chuyển
sang hộp thoại Variables in Set bên phải
Sau đó chỉ định cách mã hóa các biến đó (dichotomy hay category); dãy giá trị mã hóa (Range …Through) xác
định khoảng biến thiên cho các giá trị trong biến gộp; xác định tên và gán nhãn cho biến gộp. Sau đó ấn thanh Add
để đưa tên nhóm vừa xác định vào hộp Multi Response Sets.
Sử dụng các tên nhóm đa biến đã được định nghĩa bằng công cụ Define Multi Response Sets đã được đề cập ở
phần trên sau đó vào Analyze\Multiple response và chọn Frequencies hoặc Crosstabs tùy theo nhu cầu lập bảng
một biến hay đa biến
4. Xử lý câu hỏi nhiều lựa chọn
-Mã hóa: Cách thức khai báo Value: có 2 cách thức
+Cách 1: dùng dạng câu hỏi phân đôi Có – Không (Dạng biến Dichotomy)

+Cách 2: dùng chính số thứ tự của biến để mã hoá: 1, 2, 3… (Dạng biến Category)
6
Đối với câu hỏi nhiều lựa chọn, khi cần phân tích tần số chúng ta không sử dụng công cụ thống kê mô tả tính
Frequency thông thường. Công cụ dùng xử lý câu hỏi nhiều lựa chọn là Multiple Response.
-Định dạng biến tổng hợp:
B1: Từ menu Analyze-> Multiple Response->Define Variable Sets… để mở hộp thoại sau:

B2: Chọn tất cả các biến thuộc câu nhiều lựa chọn đưa vào khung Variables in Set.
B3: Khai báo cách mã hoá ở khung Variables Are Coded As:
+Nếu dùng cách mã hoá 1: dùng dạng câu hỏi phân đôi Có – Không, ta sẽ khai báo biến ở dòng Dichotomies. Và
sẽ đếm giá trị “Có” ở ô Counted value. Ví dụ ta khai báo 1. Không, 2. Có, nên ở ô này ta sẽ nhập giá trị cần đếm là
“2”
+Nếu dùng cách mã hoá 2, ta sẽ khai báo ở dòng Categories, và đếm các số thứ tự của biến. Ví dụ có 6 biến, ta sẽ
đếm từ giá trị 1 đến 6 tại ô Range: 1 through: 6.
B4: Khai báo tên và nhãn biến ở khung Name và Label.
B5: Click vào Add để xác nhận biến tổng hợp đã được tạo-> Click chọn Close để hoàn tất quá trình định dạng biến
tổng hợp.
-Phân tích tần số (Frequency):
B1: Từ menu Analyze-> Multiple Response -> Frequency, xuất hiện hộp thoại sau:

7
B2: Đưa biến tổng hợp vừa tạo ở phần trên vào ô Tables for-> Click chọn Ok để hoàn tất thao tác.
B3: Kết quả hiện ra ở cửa sổ Output như sau:

+Percent of Cases: phần trăm trên tổng số bệnh nhân được quan sát (50 bệnh nhân)
+Percent of Responses: phần trăm trên tổng sự trả lời (vì mỗi bệnh nhân có thể có nhiều tiền sử phẩu thuật nên
tổng sự trả lời = 55 > cỡ mẫu quan sát = 50)

THỐNG KÊ CROSSTABS: 2 yếu tố tương quan với nhau


=> cách làm: analyze -> descriptives statictic -> crosstabs
THỐNG KÊ TABLES: nhiều yếu tố
=> cách làm: analyze -> tables -> custom

KIỂM TRA ĐỘ TIN CẬY CỦA THANG ĐO (Cronbach’s Alpha):


để đảm bảo tính ổn định của thang đo (scale’s internal consistency)
Trình tự tiến hành :
- Analyze /Scale/ Reliability Analysis
- Lựa chon tất cả các Item của một construct chuyển vào hộp thoại Items
- Trong vùng Model, lựa chọn Alpha
8
- Click vào Statistics, trong vùng Descriptives for lựa chọn Item, Scale, Scale if item deleted
- Click vào Continue, sau đó ấn OK.
Tiêu chí: hệ số Cronbach’s Alpha>= 0,6; hệ số tương quan biến tổng lớn hơn 0,3 thì đạt yêu cầu.

PHÂN TÍCH NHÂN TỐ KHÁM PHÁ EFA:


Phân tích nhân tố khám phá sắp xếp các biến theo nhân tố và sàng lọc các biến không đạt yêu cầu
*Analyze > Dimension Reduction > Factor…
Đưa biến quan sát của các biến độc lập cần thực hiện phân tích EFA vào mục Variables, nếu có biến quan sát nào
bị loại ở bước trước đó, sẽ không đưa vào phân tích EFA
+Descriptives: Tích vào mục KMO and Barlett’s test of sphericity để xuất bảng giá trị KMO và giá trị sig của kiểm
định Barlett. Nhấp Continue để quay lại cửa sổ ban đầu.
+Extraction: Ở đây, chúng ta sẽ sử dụng phép trích PCA (Principal Components Analysis), còn lại theo mặc định
của spss
+Rotation: Xoay nhân tố là thủ tục giúp ma trận nhân tố trở nên đơn giản và dễ giải thích hơn. Ở đây có các phép
quay, thường chúng ta hay sử dụng Varimax và Promax. Riêng với dạng đề tài đã xác định được biến độc lập và
biến phụ thuộc, chúng ta sử dụng phép quay Varimax.
9
+ Options: Tích vào Sorted by size để ma trận xoay sắp xếp thành từng cột dạng bậc thang để dễ đọc kết quả hơn,
chúng ta có thể tích hoặc không tích, việc này không ảnh hưởng đến kết quả. Chọn mục Suppress small
coefficients và nhập hệ số tải là 0.5, nhấp vào Continue để đóng cửa sổ.
Tại cửa sổ tiếp theo, chọn OK để xuất kết quả ra output.
+Trị số KMO [0,5;1] là điều kiện đủ để phân tích nhân tố thích hợp
+Hệ số sig Barlett <0,05
+Hệ số Eigenvalue >=1 và tổng phương sai trích >50%
+Hệ số tải nhân tố (factor loading) >=0.3

Hệ số KMO = 0.879 > 0.5, sig Barlett’s


Test = 0.000 < 0.05, như vậy phân tích nhân
tố là phù hợp.

Có 6 nhân tố được trích dựa vào tiêu chí eigenvalue


lớn hơn 1, như vậy 6 nhân tố này tóm tắt thông tin của
26 biến quan sát đưa vào EFA một cách tốt nhất. Tổng
phương sai mà 6 nhân tố này trích được là 63.357% >
50%, như vậy, 6 nhân tố được trích giải thích được
63.357% biến thiên dữ liệu của 26 biến quan sát tham
gia vào EFA.

10
Kết quả ma trận xoay cho thấy, 26 biến quan sát được phân
thành 6 nhân tố, tất cả các biến quan sát đều có hệ số tải
nhân tố Factor Loading lớn hơn 0.5 và không còn các biến
xấu.

*Phương thức loại biến xấu trong EFA


+Loại tất cả các biến xấu dạng 1 ( Biến quan sát không đảm bảo hệ số tải tiêu chuẩn <0.5) trước tiên và phân tích
lại EFA
+Nếu tiếp tục xuất hiện biến xấu dạng 1, vẫn loại các biến này trước và chạy tiếp EFA. Nếu không còn biến xấu
dạng 1, loại biến xấu dạng 2 (Biến quan sát chỉ nằm tách biệt một mình ở một nhân tố) và phân tích lại EFA
+Nếu tiếp tục xuất hiện biến xấu dạng 2, vẫn loại các biến này trước và chạy tiếp EFA. Nếu không còn biến xấu
dạng 2, loại biến xấu dạng 3 (Tải lên nhiều nhóm nhân tố và chênh lệch hệ số tải nhỏ hơn 0.2) và phân tích lại
EFA.

PHÂN TÍCH TƯƠNG QUAN PEARSON


Mục đích chạy tương quan Pearson nhằm kiểm tra mối tương quan tuyến tính chặt chẽ giữa biến phụ thuộc với các
biến độc lập và sớm nhận diện vấn đề đa cộng tuyến khi các biến độc lập cũng có tương quan mạnh với nhau.
*Analyze > Correlate > Bivariate…
Tại đây, chúng ta đưa hết tất cả các biến muốn chạy tương quan Pearson vào mục Variables. Để tiện cho việc đọc
kết quả, chúng ta nên đưa biến phụ thuộc lên trên cùng.
Pearson là dùng cho dữ liệu định lượng dạng số, kendai’l và speaman là định tính chuyển định lượng, two-tailed là
2 chiều

11
Kết quả tương quan Pearson sẽ được thể hiện trong bảng Correlations. Điểm qua các ký hiệu trong bảng này:
Pearson Correlation là hệ số tương quan Pearson (r), Sig. (2-tailed) là giá trị sig của kiểm định t đánh giá hệ số
tương quan Pearson có ý nghĩa thống kê hay không, N là cỡ mẫu.
Hệ số tương quan Pearson r có giá trị dao động từ -1 đến 1:
+Nếu r càng tiến về 1, -1: tương quan tuyến tính càng mạnh, càng chặt chẽ. Tiến về 1 là tương quan dương, tiến về
-1 là tương quan âm.
+Nếu r càng tiến về 0: tương quan tuyến tính càng yếu.
+Nếu r = 1: tương quan tuyến tính tuyệt đối, khi biểu diễn trên đồ thị phân tán Scatter như hình vẽ ở trên, các điểm
biểu diễn sẽ nhập lại thành 1 đường thẳng.
+Nếu r = 0: không có mối tương quan tuyến tính. Lúc này sẽ có 2 tình huống xảy ra. Một, không có một mối liên
hệ nào giữa 2 biến. Hai, giữa chúng có mối liên hệ phi tuyến.
P/S: Khi sig nhỏ hơn 0.05 thì chỗ hệ số tương quan Pearson chúng ta sẽ thấy ký hiệu * hoặc **.
+Ký hiệu ** cho biết rằng cặp biến này có sự tương quan tuyến tính ở mức tin cậy đến 99% (tương ứng mức ý
nghĩa 1% = 0.01).
+Ký hiệu * cho biết rằng cặp biến này có sự tương quan tuyến tính ở mức tin cậy đến 95% (tương ứng mức ý nghĩa
5% = 0.05).

PHÂN TÍCH HỒI QUY TUYẾN TÍNH


Nghiên cứu mối liên hệ giữa một tiêu thức kết quả với một hoặc nhiều tiêu thức nguyên nhân, biểu diễn thông qua
đường thẳng.
Cả biến phụ thuộc và biến độc lập đều cần là những biến định lượng
* Analyze > Regression > Linear…
Đưa biến phụ thuộc vào ô Dependent, các biến độc lập vào ô Independents.
Vào mục Statistics, tích chọn các mục như trong ảnh và chọn Continue.

12
Vào mục Plots, tích chọn vào Histogram và Normal probability plot, kéo biến ZRESID thả vào ô Y, kéo biến
ZPRED thả vào ô X như hình bên dưới. Tiếp tục chọn Continue.

Các mục còn lại chúng ta sẽ để mặc định. Quay lại giao diện ban đầu, mục Method là các phương pháp đưa biến
vào, tùy vào dạng nghiên cứu mà chúng ta sẽ chọn Enter hoặc Stepwise. Tính chất đề tài thực hành là nghiên cứu
khẳng định, do vậy tác giả sẽ chọn phương pháp Enter đưa biến vào một lượt. Đây là phương pháp mà SPSS sẽ xử
lý tất cả các biến độc lập mà nhà nghiên cứu muốn đưa vào mô hình. Tiếp tục nhấp vào OK.

13
+Bảng ANOVA
Chúng ta cần đánh giá độ phù hợp mô hình một cách chính xác qua kiểm định giả thuyết. Để kiểm định độ phù hợp
mô hình hồi quy, chúng ta đặt giả thuyết H0: R2 = 0. Phép kiểm định F được sử dụng để kiểm định giả thuyết này.
Kết quả kiểm định:
Sig < 0.05: Bác bỏ giả thuyết H0, nghĩa là R2 ≠ 0 một cách có ý nghĩa thống kê, mô hình hồi quy là phù hợp.
Sig > 0.05: Chấp nhận giả thuyết H0, nghĩa là R2 = 0 một cách có ý nghĩa thống kê, mô hình hồi quy không phù
hợp.
Trong SPSS, các số liệu của kiểm định F được lấy từ bảng phân tích phương sai ANOVA.

(VD: Bảng ANOVA cho chúng ta kết quả kiểm định F để đánh giá giả thuyết sự phù hợp của mô hình hồi quy. Giá
trị sig kiểm định F bằng 0.000 < 0.05, do đó, mô hình hồi quy là phù hợp.)
+ Bảng Model Summary

14
Hệ số tương quan R đo lường mức độ tương quan giữa hai biến. Kết quả trên cho thấy giá trị hệ số tương quan (R)
là 0.837 > 0.5. Đây là mô hình thích hợp để sử dụng đánh giá mối quan hệ giữa biến phụ thuộc và các biến độc
lập.
Hệ số xác định R2 đánh giá mức độ phù hợp của mô hình thể hiện mối quan hệ tương quan tuyến tính
(Trong ví dụ ở trên, bảng Model Summary cho chúng ta kết quả R bình phương (R Square) và R bình phương hiệu
chỉnh (Adjusted R Square) để đánh giá mức độ phù hợp của mô hình. Giá trị R bình phương hiệu chỉnh bằng 0.695
cho thấy các biến độc lập đưa vào phân tích hồi quy ảnh hưởng 69.5% sự biến thiên của biến phụ thuộc, còn lại
31.4% là do các biến ngoài mô hình và sai số ngẫu nhiên.
Kết quả bảng này cũng đưa ra giá trị Durbin–Watson để đánh giá hiện tượng tự tương quan chuỗi bậc nhất. Giá trị
DW = 1.849, nằm trong khoảng 1.5 đến 2.5 nên kết quả không vi phạm giả định tự tương quan chuỗi bậc nhất
(Yahua Qiao, 2011).)
Nếu R <0,3 Nếu R2 <0,1 Tương quan ở mức thấp
Nếu 0,3 ≤ R <0,5 Nếu 0,1 ≤ R2 <0,25 Tương quan ở mức trung bình
Nếu 0,5 ≤ R <0,7 Nếu 0,25 ≤ R2 <0,5 Tương quan khá chặt chẽ
Nếu 0,7 ≤ R <0,9 Nếu 0,5 ≤ R2 <0,8 Tương quan chặt chẽ
Nếu 0,9 ≤ R Nếu 0,8 ≤ R2 Tương quan rất chặt chẽ
+ Bảng Coefficients
Chúng ta sẽ đánh giá hệ số hồi quy của mỗi biến độc lập có ý nghĩa trong mô hình hay không dựa vào kiểm định t
(student) với giả thuyết H0: Hệ số hồi quy của biến độc lập Xi bằng 0. Mô hình hồi quy có bao nhiêu biến độc lập,
chúng ta sẽ đi kiểm tra bấy nhiêu giả thuyết H0. Kết quả kiểm định:
 Sig < 0.05: Bác bỏ giả thuyết H0, nghĩa là hệ số hồi quy của biến Xi khác 0 một cách có ý nghĩa thống kê,
biến X1 có tác động lên biến phụ thuộc.
 Sig > 0.05: Chấp nhận giả thuyết H0, nghĩa là hệ số hồi quy của biến Xi bằng 0 một cách có ý nghĩa thống
kê, biến Xi không tác động lên biến phụ thuộc.
Trong hồi quy, thường chúng ta sẽ có hai hệ số hồi quy: chưa chuẩn hóa (B) và đã chuẩn hóa (Beta). Nếu hệ số hồi
quy (B hoặc Beta) mang dấu âm, nghĩa là biến độc lập đó tác động nghịch chiều lên biến phụ thuộc. Ngược lại nếu
B hoặc Beta không có dấu (dấu dương), nghĩa là biến độc lập tác động thuận chiều lên biến phụ thuộc. Khi xem xét
mức độ tác động giữa các biến độc lập lên biến phụ thuộc, chúng ta sẽ dựa vào trị tuyệt đối hệ số Beta, trị tuyệt đối
Beta càng lớn, biến độc lập tác động càng mạnh lên biến phụ thuộc.
Trong SPSS, các số liệu của kiểm định t được lấy từ bảng hệ số hồi quy Coefficients.

15
(Trong ví dụ ở trên, bảng Coefficients cho chúng ta kết quả kiểm định t để đánh giá giả thuyết ý nghĩa hệ số hồi
quy, chỉ số VIF đánh giá đa cộng tuyến và các hệ số hồi quy.
Biến F_DN có giá trị sig kiểm định t bằng 0.777 > 0.05 , do đó biến này không có ý nghĩa trong mô hình hồi quy,
hay nói cách khác, biến này không có sự tác động lên biến phụ thuộc F_HL. Các biến còn lại gồm F_LD, F_CV,
F_TL, F_DT, F_DK đều có sig kiểm định t nhỏ hơn 0.05, do đó các biến này đều có ý nghĩa thống kê, đều tác động
lên biến phụ thuộc F_HL. Hệ số hồi quy các biến độc lập này đều mang dấu dương, như vậy các biến độc lập có
tác động thuận chiều lên biến phụ thuộc.
Hệ số phóng đại phương sai (VIF) là một chỉ số đánh giá hiện tượng cộng tuyến trong mô hình hồi quy. VIF càng
nhỏ, càng ít khả năng xảy ra đa cộng tuyến. Hair và cộng sự (2009) cho rằng, ngưỡng VIF từ 10 trở lên sẽ xảy ra đa
cộng tuyến mạnh. Nhà nghiên cứu nên cố gắng để VIF ở mức thấp nhất có thể, bởi thậm chí ở mức VIF bằng 5,
bằng 3 đã có thể xảy ra đa cộng tuyến nghiêm trọng. Theo Nguyễn Đình Thọ (2010) , trên thực tế, nếu VIF > 2,
chúng ta cần cẩn thận bởi vì đã có thể xảy ra sự đa cộng tuyến gây sai lệch các ước lượng hồi quy.
->Từ các hệ số hồi quy, chúng ta xây dựng được hai phương trình hồi quy chuẩn hóa và chưa chuẩn hóa theo thứ tự
như sau:
Y = 0.322*F_LD + 0.288*F_CV + 0.096*F_TL + 0.076*F_DT + 0.421*F_DK + ε
Nếu giải thích theo phương trình hồi quy đã chuẩn hóa, khi biến F_LD tăng 1 đơn vị độ lệch chuẩn (standard
deviation), thì biến Y tăng 0.322đơn vị độ lệch chuẩn.
Y= -0.475 + 0.267*F_LD + 0.259*F_CV + 0.084*F_TL + 0.066*F_DT + 0.393*F_DK + ε
Xét biến F_LD, nếu giải thích theo phương trình hồi quy chưa chuẩn hóa, nếu biến F_LD tăng 1 đơn vị, thì biến
Y tăng 0.267 đơn vị. Tương tự cho các biến khác

16
+ Biểu đồ tần số phần dư chuẩn hóa Histogram: Đối với biểu đồ
Histogram, nếu giá trị trung bình Mean gần bằng 0, độ lệch chuẩn
Std. Dev gần bằng 1, các cột giá trị phần dư phân bố theo dạng
hình chuông, ta có thể khẳng định phân phối là xấp xỉ chuẩn, giả
định phân phối chuẩn của phần dư không bị vi phạm

+ Biểu đồ phần dư chuẩn hóa Normal P-P Plot: Đối với biểu
đồ Normal P-P Plot, nếu các điểm dữ liệu trong phân phối
của phần dư bám sát vào đường chéo, phần dư càng có phân
phối chuẩn. Nếu các điểm dữ liệu phân bố xa đường chéo,
phân phối càng “ít chuẩn”.

+ Biểu đồ Scatter Plot kiểm tra giả định liên hệ tuyến


tính: Phần dư phân tán ngẫu nhiên: dựa trên biểu đồ
cho ta thấy phần dư phân tán ngẫu nhiên trong 1 vùng
và đi qua gốc tọa độ 0 chứ không tạo nên hình dạng
bất kì nào. Như vậy, nghiên cứu có thể nói rằng giả
định về quan hệ tuyến tính không quy phạm. Như vậy
mô hình tuyến tính phù hợp

KIỂM ĐỊNH GIẢ THUYẾT VỀ TRỊ TRUNG BÌNH CỦA 2 TỔNG THỂ ĐỘC
LẬP (Independent Samples T-test)
Kiểm định này dùng cho hai mẫu độc lập, dạng dữ liệu là dạng thang đo hay tỷ lệ. kiểm định sự khác biệt trung
bình giữa hai nhóm độc lập. Hai nhóm độc lập là hai nhóm mà các quan sát trong hai nhóm không có mối quan hệ

17
với nhau. Ví dụ, hai nhóm nam và nữ, hai nhóm sử dụng hai loại thuốc khác nhau, hai nhóm sinh viên học hai
chương trình khác nhau,...
Đối với dạng kiểm định này, các đối tượng cần kiểm nghiệm được xếp một cách ngẫu nhiên vào hai nhóm sao cho
bất kỳ một khác biệt nào từ kết quả nghiên cứu là do sự tác động của chính nhóm thử đó, chứ không phải do yếu tố
khác.
Cần có hai biến tham gia trong phép kiểm định trung bình: 1 biến định lượng và 1 biến định tính dùng để chia
nhóm so sánh
*Vào Analyze > Compare Means > Independent-Samples T Test...
Cửa sổ Independent-Samples T Test xuất hiện, đưa biến định lượng (likert…) vào mục Test Variable (s), có thể
đưa nhiều biến định lượng vào mục này để đánh giá trung bình cùng lúc. Tiếp tục đưa biến định tính (giới tính…)
vào mục Grouping Variable, lúc này mục Define Groups... sẽ sáng lên, chúng ta nhấp vào mục này.

Biến Giới tính có hai giá trị đã được mã hóa gồm 1 là nam và 2 là nữ, chúng ta sẽ điền hai số này vào hai ô trống
Group 1 và Group 2. Tiếp tục nhấp vào Continue để quay về cửa sổ ban đầu. Sau đó nhấp OK để xuất kết quả ra
output.
Kết quả kiểm định gồm hai bảng là Group Statistics và Independent Samples Test. Chúng ta sẽ đọc kết quả ở bảng
Independent Samples Test trước.
+sig Levene <0.05 -> phương sai khác nhau -> dùng kết quả hàng Equal variances not assumed
Sig t-test <0.05: có sự khác biệt (bác bỏ giải thuyết H0)
Sig t-test >=0.05: không có sự khác biệt (chấp nhận giải thuyết H0)
+sig Levene >=0.05 -> phương sai không khác nhau (đồng nhất) -> dùng kết quả hàng Equal variances assumed
Sig t-test <0.05: có sự khác biệt (bác bỏ giải thuyết H0)
Sig t-test >=0.05: không có sự khác biệt (chấp nhận giải thuyết H0)

18
(Sig kiểm định F bằng 0.144 > 0.05, không có sự khác biệt phương sai giữa hai nhóm nam và nữ, chúng ta sẽ sử
dụng kết quả kiểm định t ở hàng Equal variances assumed. Sig kiểm định t bằng 0.491 > 0.05, chấp nhận giả thuyết
H0, nghĩa là không có sự khác biệt trung bình F_HL giữa các giới tính khác nhau. Như vậy, không có khác biệt sự
hài lòng công việc giữa nhân viên nam và nhân viên nữ trong công ty.)

(Bảng Group Statistics cho chúng ta các thông số mô tả của từng nhóm giới tính. Giá trị trung bình ở hai nhóm đều
nằm trong đoạn 3.41 – 4.20, nghĩa là nhân viên nam và nữ đều cảm thấy hài lòng về công việc. Giá trị trung bình
của hai nhóm nam/nữ bằng 3.5012 và 3.4523, không có sự chênh lệch nhiều.)

PHÂN TÍCH ONE-WAY ANOVA


so sánh khác biệt trung bình 1 biến định lượng đối với những giá trị khác nhau của biến định tính
Phân tích phương sai ANOVA là phương pháp so sánh trị trung bình của 3 nhóm trở lên. Các nhóm này có thể độc
lập hoặc phụ thuộc với nhau. Ví dụ, kiểm định sự khác biệt trung bình điểm thi giữa ba lớp học, kiểm định sự khác
biệt trung bình mức độ hài lòng công việc giữa ba nhóm nhân viên khác nhau,... Có 2 kỹ thuật phân tích phương
sai: ANOVA 1 yếu tố (một biến yếu tố để phân loại các quan sát thành các nhóm khác nhau) và ANOVA nhiều
yếu tố (2 hay nhiều biến để phân loại). Ở phần thực hành cơ bản chỉ đề cập đến phân tích phương sai 1 yếu tố
(One-way ANOVA).
Một số giả định đối với phân tích phương sai một yếu tố:

19
-Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên.
-Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn để được xem như tiệm cận phân phối chuẩn.
-Phương sai của các nhóm so sánh phải đồng nhất.
*Từ menu Analyze-> Compare Means-> One-Way ANOVA, xuất hiện hộp thoại sau:

-Đưa biến phụ thuộc vào mục Dependent List (có thể đưa nhiều biến định lượng vào phân tích một lượt), đưa biến
định tính vào mục Factor (chỉ có thể đưa vào một biến định tính)
-Trong hộp thoại One-way ANOVA Options:
+Click chọn ô Descriptive để tính đại lượng thống kê mô tả (tính trị trung bình) theo từng nhóm so sánh.
+Click chọn ô Homogeneity of variance test để kiểm định sự bằng nhau của các phương sai nhóm (thực hiện kiểm
định Levene).
(Descriptive: xuất bảng thống kê mô tả đặc điểm các nhóm giá trị như tần suất, trung bình (mean), độ lệch chuẩn…
Homogeneity of vaiance test: đưa ra kết quả kiểm định khác biệt phương sai của các nhóm giá trị bằng kiểm định
Levene.
Welch hoặc Brown-Forsythe: cung cấp kết quả kiểm định khác biệt trung bình trong trường hợp có khác biệt
phương sai giữa các nhóm giá trị. Hai kiểm định này chung một mục đích nhưng cách tiếp cận là khác nhau, do
vậy sẽ có trường hợp hai kiểm định cho ra kết quả không thống nhất với nhau. Thường các nhà nghiên cứu sử dụng
Welch nhiều hơn.
Means plot: xuất đồ thị biểu diễn mối quan hệ giữa biến định lượng với biến định tính, giúp chúng ta có cái nhìn
trực quan về sự khác biệt giữa các nhóm giá trị.)
-Click chọn Continue để trở lại hộp thoại ban đầu -> click Ok để thực hiện lệnh.
Kết quả kiểm định gồm nhiều bảng, chúng ta sẽ đọc kết quả ở bảng Test of Homogeneity of Variances trước.

20
Sig Levene >0.05-> phương sai đồng nhất ->sử dụng kết quả kiểm định F ở bảng ANOVA
Sig Levene <0.05-> phương sai khác nhau-> Robust Tests (Kiểm định Welch)

Sig kiểm định F bằng 0.639 > 0.05, chấp nhận giả thuyết H0, nghĩa là không có sự khác biệt trung bình F_HL giữa
các trình độ học vấn khác nhau. Như vậy, không có khác biệt sự hài lòng công việc giữa các nhân viên có trình độ
học vấn khác nhau.
Nếu sig F<0.05, bác bỏ H0, có sự khác biệt trung bình
-Dựa vào kết quả kiểm định ANOVA, nếu H0 được chấp nhận thì kết luận không có sự khác biệt có ý nghĩa giữa
các nhóm với nhau. Nếu H0 bị bác bỏ -> có sự khác biệt có ý nghĩa giữa các nhóm -> trở lại hộp thoại One – way
ANOVA để thực hiện kiểm định sâu ANOVA nhằm xác định cụ thể trung bình của nhóm nào khác với nhóm nào,
nghĩa là tìm xem sự khác biệt của các nhóm xảy ra ở đâu.

Bảng Descriptives cho chúng ta các thông số mô tả của từng mức học vấn. Giá trị trung bình của các nhóm học vấn
nằm trong đoạn 3.41 – 4.20 (ý kiến đồng ý), nghĩa là dù nhân viên có học vấn khác nhau, họ đều cảm thấy hài lòng
về công việc.

21
KIỂM ĐỊNH CHI BÌNH PHƯƠNG
Kiểm định Chi bình phương được sử dụng khi chúng ta muốn đánh giá xem liệu có mối quan hệ giữa hai biến định
tính hay biến phân loại (categorical variables) trong một tập dữ liệu hay không. Ví dụ, chúng ta cần đánh giá xem
độ tuổi và thâm niên của nhân viên trong công ty có quan hệ với nhau không, giới tính và tình trạng hôn nhân của
khách hàng có sự liên kết nào hay không...
Giả thuyết Ho: Thâm niên và Thu nhập không có mối quan hệ với nhau (độc lập nhau)
*Analyze > Descriptives Statistics > Crosstabs

Tại cửa sổ Crosstabs đưa biến Thâm niên vào ô


Row(s) và biến Thu nhập vào ô Column(s), có thể
đưa một trong hai biến vào bất kỳ mục Rows hay
Column đều được, không ảnh hưởng đến kết quả
kiểm định. Chọn Display clustered bar charts để
hiển thị đồ thị mối quan hệ hai biến.

Nhấp vào tùy chọn Statistics, tích chọn vào Chi-square sau đó nhấp vào Continue.

22
Chọn các kiểm định cần thiết. Trong trường hợp này ta dùng
kiểm định Chi – bình phương (Chi-square).
+Các kiểm định ở ô Norminal dùng để kiểm định mối liên hệ
giữa các biến biểu danh.
+Các kiểm định ở ô Ordinal dùng để kiểm định mối liên hệ
giữa các biến thứ tự.

Mở hộp thoại Cells nhằm xác định cách thể hiện các giá trị thống kê trong từng ô của bảng chéo, hộp thoại sau xuất
hiện:

Ở ô Counts chọn Observed (thể hiện tần số quan sát). Trong trường
hợp muốn thể hiện tần số mong đợi chọn Expected.
Chọn cách thể hiện phần trăm theo dòng hay theo cột ở ô
Percentages.

Click Continue để trở lại hộp thoại Crosstabs-> Ok để thực hiện lệnh.
Trong kết quả ở Output, bảng Crosstabulation cho chúng ta cái nhìn sơ bộ về mối quan hệ giữa hai biến này về mặt
thống kê tần số.
Tiếp đến, chúng ta sẽ đọc bảng quan trọng nhất là Chi-Square Tests. Nếu giá trị Asymptotic Significance (2-sided)
hàng Pearson Chi-Square nhỏ hơn 0.05. Chúng ta bác bỏ giả thuyết Ho, nghĩa là 2 biến Thâm niên và Thu nhập có
mối quan hệ với nhau. Nếu giá trị Sig này lớn hơn 0.05, chúng ta chấp nhận giả thuyết Ho, tương đương rằng
Thâm niên và Thu nhập không có mối quan hệ với nhau.

23
TÍNH TRỊ TRUNG BÌNH (2 CÁCH)
CÁCH 1. DÙNG LỆNH FREQUENCY
1.Vào menu Analyze -> Descriptive Statistics -> Frequencies. Đưa biến cần tính trị trung bình vào ô variables như
bước 1 và 2 ở phần trước.
2.Click chọn thẻ Statistic, mở hộp thoại, và click chọn các thông số cần thiết:

3.Ý nghĩa một số thông số thông dụng:


Mean: trung bình cộng
Sum: tổng cộng (cộng tất cả các giá tị trong tập dữ liệu
quan sát)
Std. Deviation: độ lệch chuẩn
Minimum: giá trị nhỏ nhất; Maximum: giá trị lớn nhất
S.E. mean: sai số chuẩn khi ước lượng trị trung bình

CÁCH 2: Mô tả dữ liệu (Descriptive)

KIỂM ĐỊNH PAIRED-SAMPLES T-TEST


Analyze > Compare Means > Paired-Samples T Test
Xuất hiện hộp thoại Paired-Samples T Test, đưa 2 biến muốn kiểm định trị trung bình vào khung Paired Variables
Tại tùy chọn Options, mặc định phần mềm chọn độ tin cậy là 95% (tương ứng mức ý nghĩa 5%). Sau khi đã nhập
độ tin cậy, chọn Continue, quay lại cửa sổ ban dầu, chọn OK.
Kết quả Output sẽ có 3 bảng. Bảng cần quan tâm đầu tiên là Paired Samples Test. Chúng ta cần chú ý đến giá trị
sig kiểm định t ở cuối bảng

24
Giá trị sig = 0.000 < 0.05-> bác bỏ H0, như vậy có sự khác biệt trung bình mức điểm đánh giá sự hài lòng của nhân
viên giữa 2 lần khảo sát.

Bảng tiếp theo là Paired Samples Statistics cho ta thấy sự khác biệt trung bình cụ thể như thế nào. Cột Mean trong
bảng thể hiện trung bình mức điểm đánh giá của 2 lần khảo sát. Có thể thấy được rằng, ở lần khảo sát 2, nhân viên
hài lòng hơn về chính sách phân chia hoa hồng. Lần 2 điểm trung bình đánh giá là 6.17 cao hơn 5.48 là điểm trung
bình của lần 1.
=> Có sự khác biệt sự hài lòng của nhân viên đối với việc áp dụng chính sách phân chia hoa hồng mới. Việc áp
dụng chính sách mới làm nhân viên hài lòng hơn chính sách cũ.
Bảng cuối cùng là Paired Sample Correlations. Bảng này cho biết có mối tương quan về dữ liệu giữa 2 lần khảo sát
hay không. Việc tương quan hay không tương quan của dữ liệu ở 2 lần khảo sát không có mối quan hệ nhân quả
với kết quả kiểm định Paired Sample T-Test.

Giá trị sig < 0.05 nghĩa là dữ liệu có tương quan. Nếu sig > 0.05, dữ liệu 2 lần khảo sát không có sự tương quan với
nhau
KIỂM ĐỊNH ONE SAMPLE T-TEST: dùng để kiểm định xem giá tị trung bình của biến nào đó có đúng bằng 1
giá trị cho trước ko.
+ căn cứ vào giá trị sig: chấp nhận H0 khi sig > 5% (H0 là giá trị trung bình của biến X = a), chấp nhận H1 khi sig
< 5%
=> analize => compare mean => one sample t-test: đưa biến vào => nhập giá trị cần kiểm định

TẠO NHÂN TỐ ĐẠI DIỆN BẰNG TRUNG BÌNH CỘNG


Biến đại diện được tạo bằng cách tính trung bình cộng các biến quan sát của nhân tố đó. Với các nghiên cứu sử
dụng thước đo Likert, hay các thước đo ảo với giá trị đo là số nguyên thì cách xây dựng biến đại diện bằng cách
này rất phù hợp. Phương thức này sẽ giúp ích cho nhà nghiên cứu có thể triển khai các bước phân tích sau hồi quy
mà không gặp nhiều khó khăn
*Transform > Compute Variables…

25
Target Variable: Điền tên biến đại diện.
Numeric Expression: Nhập hàm MEAN(giá trị 1,giá
trị 2,giá trị 3,…). Cụ thể ở đây là
MEAN(TL1,TL2,TL3,TL4). Tên hàm có thể viết
hoa hoặc viết thường, các giá trị trong hàm ngăn
cách nhau bằng dấu phẩy và không có khoảng cách
trắng.

Khi khai báo tên biến, chúng ta có thể vào Type & Label để nhập nhãn biến. Phần này không bắt buộc, có thể điền
hoặc không điền.
Sau khi khai báo biến, hàm, nhãn biến, nhấp vào OK để xác nhận hoàn thành.

HỒI QUY CHO NHÓM THU NHẬP DƯỚI 3 TRIỆU

B1: Mã hóa lại biến bằng lệnh Recode


Transform/Recode Into Different Variables
Đưa biến cần mã hoá lại là biến thunhap từ khung chứa bộ biến sang khung Numeric Variable -> Output Variable.
Tại khung Output Variable, khai báo tên và nhãn cho biến mới-> Click chọn Change để thực hiện thay biến.
Tiếp tục thay đổi giá trị của biến bằng cách click chọn Old and New Values…, mở hộp thoại sau:

26
Recode xong sau đó nhập liệu lại bằng Value Lables ở trang Variable View: 1 gán cho dưới 3tr, 2 gán cho trên 3tr
Sau đó lọc dữ liệu bằng select cases
* Data – Select Cases, chọn biến thunhap đã mã hóa ở bước trên
chọn mục If condition is satisfied, nhấn nút If
trong hộp điều kiện, nhập vào giá trị thunhapmoi=1 , xong bấm continue, và bấm OK
( Do quy định thu nhập dưới 3tr là 1, trên 3tr là 2)
-> continue->OK. Như vậy các biến trên 3tr sẽ bị gạch bỏ. Sau đó chạy lại hồi quy như bình thường

CÁCH KHAI BÁO BIẾN VÀ NHẬP LIỆU TRONG SPSS


1. Khai báo biến
Sau khi khởi động SPSS, nhấp chuột vào cửa sổ Variable View để chuyển sang màn hình khai báo biến. Mỗi biến
được tạo ra trên 1 dòng, các cột trên dòng thể hiện các thuộc tính của biến

- Name (tên biến): độ dài không quá 8 ký tự hay ký số, không có


ký tự đặc biệt và không bắt đầu bằng ký số, gõ trực tiếp tên biến
vào ô trong cột Name.
- Type (kiểu biến): mặc định chương trình sẽ chọn kiểu định
lượng (Numberic). Các kiểu biến bao gồm:
+Numeric: các giá trị được nhập vào và hiển thị ở dạng chữ số.
+String: định dạng kiểu ký tự, không dùng để tính toán. Kiểu
định dạng này không giới hạn số ký tự nhập vào, thường được sử
dụng cho biến mô tả.
Muốn thay đổi kiểu biến, độ rộng của biến (Width) hoặc số chữ
số thập phân (Decimal Places), ta nhấn chuột vào nút … trong ô
Type.

27
- Width (độ rộng của biến): số ký số hay ký tự tối đa có thể nhập vào.
- Decimals: số lẻ sau dấu phẩy.
- Label (nhãn của biến): câu mô tả để giải thích ý nghĩa của biến, cần ngắn gọn.
- Values: là thuộc tính quan trọng nhất để mã hóa thang đo định tính, các thông tin thu thập từ thang đo định lượng
đã ở dưới dạng số và có ý nghĩa nên không cần mã hóa.
Ví dụ: Xin vui lòng cho biết giới tính của anh/chị?
1. Nữ 2. Nam
Để thực hiện mã hóa cho câu hỏi trên, ta thực hiện các bước sau:
Bước 1: Nhấn chuột vào nút …của ô trên cột Values, hộp thoại khai báo Value Labels sẽ xuất hiện
Bước 2: Nhập các giá trị Value (mã hóa các thang đo định tính) và Label (nhãn giải thích ý nghĩa của mã số đã
nhập)
Bước 3: Nhấn nút Add
Bước 4: Tiếp tục khai báo cho các giá trị mã hóa còn lại trong câu hỏi, sau đó bấm OK

28
- Missing: khai báo các loại giá trị khuyết. Ví dụ, với câu hỏi giới tính, vì lý do nào đó người được điều tra từ chối
trả lời, trong hộp Value labels, ta quy ước giá trị 99 có nhãn là “không trả lời”, sau đó ở cột Missing ta phải khai
báo 99 là giá trị khuyết, khi thực hiện tính toán, phần mềm sẽ loại giá trị khuyết để có kết quả hợp lí. Cách đặt con
số đại diện cho Missing value cần căn cứ vào ngữ cảnh và sự lựa chọn của người xử lý (ví dụ, nếu chọn 99 làm
Missing value cho biến độ tuổi có thể gây nhầm lẫn khi cuộc điều tra có người trả lời đạt 99 tuổi, trong trường hợp
này ta có thể chọn con số khác như 999 hay -100…)

- Columns: khai báo độ rộng của biến khi nhập liệu, thường chọn 8.
- Align: vị trí dữ liệu được nhập trong cột, thường chọn Right.

29
- Measure: loại thang đo thể hiện dữ liệu gồm Norminal (thang đo danh nghĩa), Ordinary (thang đo thứ bậc), Scale
(gồm thang đo khoảng cách và thang đo tỉ lệ)

30
Sau khi thực hiện khai báo các biến ở cửa số Variable View, ta chuyển qua cửa sổ Data View, tiến hành nhập số
liệu vào SPSS cho từng biến.

BẢNG CÂU HỎI


Thân chào anh/chị,
Chúng tôi là nhóm sinh viên thuộc trường Đại học Tài chính – Marketing. Hiện tại, chúng tôi đang thực hiện
nghiên cứu với đề tài … , rất mong các Anh/Chị dành chút ít thời gian để tham gia bảng khảo sát dưới đây
Chúng tôi xin cam kết mọi thông tin của anh/Chị cung cấp dưới đây sẽ được bảo mật tuyệt đối và chỉ phục vụ cho
mục đích nghiên cứu đề tài. Sự đóng góp của quý Anh/Chị sẽ giúp ích rất nhiều cho sự thành công của bài nghiên
cứu của chúng tôi.
Trân trọng,
Nhóm tác giả.
I.Câu hỏi gạn lọc:
1. Bạn có đang sinh sống/học tập tại thành phố Hồ Chí Minh không?

☐Có (Tiếp tục khảo sát) ☐Không (Ngừng khảo sát)


2. Bạn có phải sinh viên không?

☐Có (Tiếp tục khảo sát) ☐Không (Ngừng khảo sát)


3. Bạn có sử dụng ứng dụng Shopee để mua sắm hay không?

☐Có (Tiếp tục khảo sát) ☐Không (Ngừng khảo sát)


(II. Thói quen giải trí trước và sau Covid-19
Trước khi Covid-19 bùng phát, bạn thường dành thời gian giải trí như thế nào? (Chọn tất cả các đáp án phù hợp)
Xem phim, truyền hình Thể thao
Nghe nhạc, chơi nhạc Vui chơi, giải trí ngoài trời
Đọc sách, truyện Khác (vui lòng ghi rõ)
Chơi game
Sau khi Covid-19 bùng phát, bạn thường dành thời gian giải trí như thế nào? (Chọn tất cả các đáp án phù hợp)
Xem phim, truyền hình Thể thao
Nghe nhạc, chơi nhạc Vui chơi, giải trí ngoài trời
Đọc sách, truyện Khác (vui lòng ghi rõ)
Chơi game
So với trước Covid-19, bạn có thay đổi thói quen giải trí như thế nào? (Chọn tất cả các đáp án phù hợp)
Tăng thời gian dành cho giải trí
31
Giảm thời gian dành cho giải trí
Thay đổi các hoạt động giải trí
III. Các yếu tố tác động đến sự thay đổi thói quen giải trí
Bạn cho rằng những yếu tố nào đã tác động đến sự thay đổi thói quen giải trí của bạn trong bối cảnh Covid-19?
(Chọn tất cả các đáp án phù hợp)
Dịch bệnh Covid-19 Thay đổi về sở thích, nhu cầu
Các biện pháp giãn cách xã hội Khác (vui lòng ghi rõ)
Thay đổi về thu nhập, chi tiêu
IV. Kiến nghị
Bạn có mong muốn gì đối với các hoạt động giải trí trong thời gian tới?

2.1. Mục tiêu nghiên cứu:


Bài nghiên cứu này được thực hiện nhằm tìm hiểu các nhân tố ảnh hưởng đến quyết định mua hàng trên ứng dụng
Shopee của sinh viên Thành phố Hồ Chí Minh, từ đó đề xuất giải pháp nhằm cải thiện và nâng cao chất lượng dịch
vụ, bao gồm các mục tiêu cụ thể như sau:
Khảo sát và xác định các yếu tố tác động đến quyết định mua của sinh viên trên ứng dụng Shopee.
Phân tích, đánh giá mức độ tác động của các yếu tố này đến quyết định mua hàng của sinh viên trên ứng dụng
Shopee.
Đề xuất các hàm ý, gợi ý cho chiến lược phát huy tích cực, đồng thời khắc phục các yếu tố tiêu cực giúp các doanh
nghiệp thu hút khách hàng tiềm năng hiệu quả, nâng cao lợi thế cạnh tranh của Shopee.

4.Phương pháp nghiên cứu:


-PP NC định lượng: Nghiên cứu định lượng là những nghiên cứu hướng vào việc thiết kế những quan sát định
lượng các biến, phương pháp đo lường, phân tích và giải thích mối quan hệ giữa các biến bằng các quan hệ định
lượng, do đó kết quả nghiên cứu sẽ dễ thuyết phục hơn, tuy nhiên cũng có hạn chế là kết quả nghiên cứu có thể
không đúng với thực tế nếu số liệu đầu vào có vấn đề
Dữ liệu của PP định lượng sẽ phản ánh mức độ, sự hơn kém và tính được giá trị trung bình. Mục đích của việc
nghiên cứu định lượng là kiểm định mô hình nghiên cứu đã đề ra và đo lường các nhân tố trong mô hình nghiên
cứu; đưa ra các kết luận thị trường thông qua việc sử dụng các phương pháp thống kê để xử lý dữ liệu và số liệu,
được thực hiện thông qua việc khảo sát…
(Ví dụ: Khi hỏi mức độ hài lòng của khách hàng về chất lượng dịch vụ, các câu trả lời nhận được là định tính như
"Rất không hài lòng", "Tương đối hài lòng", "Rất hài lòng”, ... Người nghiên cứu cần lượng hóa các dữ liệu định
tính này dưới dạng số như 1 (tương ứng Rất không hài lòng) đến 5 (tương ứng với Rất hài lòng) để thực hiện các
nghiên cứu định lượng)
-PP NC định tính: Phương pháp nghiên cứu định tính là một dạng nghiên cứu thường sử dụng để thăm dò, mô tả,
giải thích dựa vào nhận thức, động cơ thúc đẩy, hành vi, thái độ… tìm hiểu ý kiến, quan điểm nhằm tìm ra các vấn
đề. Ngoài ra, phương pháp này còn có thể được sử dụng để phát hiện các xu hướng của khách hàng trong tương lai,
dùng để khám phá, điều chỉnh và bổ sung cho mô hình nghiên cứu lý thuyết cũng như các biến quan sát dùng để đo
lường các thành phần của nó, thường tiếp cận đối tượng nghiên cứu một cách tự nhiên nhất, nhằm đảm bảo những
32
hành vi, ý kiến, quan điểm mà đối tượng nghiên cứu đưa ra sẽ khách quan và chính xác nhất. Nghiên cứu định tính
thường trả lời câu hỏi “như thế nào” và “tại sao” về một hiện tượng, hành vi,…
dữ liệu định tính thường ở dạng chữ, phản ánh tính chất, đặc điểm hay sự hơn kém và ta không tính được trị trung
bình của dữ liệu dạng định tính. Một số ví dụ về dữ liệu định tính: giới tính: nam hay nữ; kết quả học tập của sinh
viên: giỏi, khá, trung bình, yếu
Nhằm mục đích cung cấp một sự hiểu biết sâu rộng và giải thích về thế giới xã hội của những người tham gia
nghiên cứu bằng việc học hỏi về hoàn cảnh xã hội và vật chất của họ, kinh nghiệm, quan điểm và lịch sử của họ.
Phương pháp thu thập dữ liệu thường liên quan đến gần gũi giữa nhà nghiên cứu và người tham gia nghiên cứu, đó
là tương tác và phát triển, cho phép các vấn đề khẩn cấp để được khám phá.

PP thu thập dữ liệu

-Phương pháp phỏng vấn cá nhân trực tiếp :

Nhân viên nghiên cứu sử dụng phương pháp thu


thập dữ liệu phỏng vấn cá nhân trực tiếp bằng
cách gặp mặt trực tiếp các đối tượng điều tra và
phỏng vấn họ bằng bảng câu hỏi đã được thiết lập
sẵn. Để áp dụng được phương pháp này, bạn cần
phải đưa ra cho khách hàng những câu hỏi đơn
giản, ngắn gọn và dễ trả lời. Ứng dụng tốt phương
pháp này, nhân viên sẽ thuyết phục được khách
hàng đưa ra câu trả lời, giải thích rõ ràng về câu
trả lời đó trước khi điền vào phiếu điều tra

-Phương pháp phỏng vấn qua điện thoại :

Khi thực hiện thu thập dữ liệu bằng phương


pháp phỏng vấn điện thoại, nhân viên phỏng
vấn sẽ trực tiếp điều tra các đối tượng cần
nghiên cứu bằng một số câu hỏi đã được thiết
lập sẵn. Các đối tượng có thể áp dụng được
phương pháp này đó là các cơ quan xí nghiệp,
các đối tượng phân tán đều trên địa bàn hay
những người có thu nhập cao để tiết kiệm chi
phí. Với phương pháp này, doanh nghiệp có
thể thiết lập được mối quan hệ tốt đẹp hơn với
các đối tượng nghiên cứu. 33
- PP phỏng vấn Gửi phiếu điều tra dưới dạng bảng hỏi
Đây là phương pháp thu thập thông tin trong nghiên cứu khoa học thông qua việc gửi bảng câu hỏi đã được soạn
sẵn. Sau đó sẽ được dán tem đến người muốn phỏng vấn thông qua đường bưu điện hoặc gửi bản mềm qua
internet. Phương thức này được áp dụng khi khó đối mặt, ở khoảng cách xa hoặc khi vấn đề điều tra thuộc loại khó
nói và mang tính riêng tư.
Tiết kiệm thời gian, công sức và chi phí.
Dễ dàng thu thập được dữ liệu về các vấn đề rộng lớn, phức tạp.

3. Đối tượng và phạm vi nghiên cứu:


3.1.Đối tượng nghiên cứu:
Đối tượng nghiên cứu: Các nhân tố ảnh hưởng đến quyết định mua hàng trên ứng dụng Shopee của sinh viên thành
phố Hồ Chí Minh.
Đối tượng khảo sát: Sinh viên đang học tập, làm việc và sinh sống tại thành phố Hồ Chí Minh có biết đến Shopee
và đã từng mua hàng trên ứng dụng Shopee.

34
Tiếp cận đối tượng khảo sát tại các trường cao đẳng, đại học,...Dựa trên nội dung trao đổi, ghi chép lại những gợi ý
điều chỉnh, bổ sung của các đối tượng, sau đó tiến hành tổng hợp.
3.2.Phạm vi nghiên cứu:
Thời gian nghiên cứu: từ 29/09/2023 đến 10/11/2023
Trong đó: Thời gian thực hiện phỏng vấn sâu: 29/09/2023 - 10/10/2023
Thời gian thực hiện khảo sát bằng bảng hỏi: 10/10/2023 - 10/11/2023
Nội dung nghiên cứu: Tập trung phân tích và đánh giá các yếu tố ảnh hưởng đến quyết định mua hàng trên ứng
dụng Shopee của sinh viên tại TP.HCM.
Không gian nghiên cứu: Tại địa bàn TP.HCM, vì đây là nơi tập trung đông dân cư, có mức độ sử dụng Internet cao
hơn nông thôn và là thị trường màu mỡ cho các doanh nghiệp lớn. Cụ thể là tại các trường đại học, cao đẳng trong
khu vực thành phố, nơi tập trung đông đảo thế hệ gen Z - những người có xu hướng mua sắm trực tuyến nhiều hơn.

Phương pháp chọn mẫu:


Nhóm tác giả sử dụng phương pháp khảo sát trực tuyến bao gồm những sinh viên tại Thành phố Hồ Chí Minh có
cài đặt và sử dụng các ứng dụng Shopee nhưng do các đối tượng khảo sát không đồng nhất về giới tính, độ tuổi, thu
nhập, nên nhóm tác giả lựa chọn phương pháp lấy mẫu thuận tiện. Đây là phương pháp phi xác suất, các đối tượng
được chọn không theo một quy tắc ngẫu nhiên mà sẽ lấy mẫu dựa trên sự thuận lợi có thể chọn được từ các đối
tượng có thể tiếp cận được. Phương pháp chọn mẫu thuận tiện là phương pháp chọn mẫu mà người nghiên cứu
chọn những đơn vị trong tổng thể nghiên cứu mà họ dễ dàng tiếp cận được. Phương pháp này có ưu điểm là đơn
giản và dễ thực hiện, tuy nhiên, nó không đảm bảo tính đại diện của mẫu. Nhóm khảo sát đã tận dụng những người
sử dụng ứng dụng Shopee mà họ biết, gặp gỡ trong cuộc sống hằng ngày để thực hiện khảo sát.

(Phương pháp chọn mẫu hợp lý nhất cho khảo sát sản phẩm sữa bột dành cho trẻ em dưới 3 tuổi tại 3 thành phố Hà
Nội, Hải Phòng, Đà Nẵng là phương pháp chọn mẫu ngẫu nhiên phân tầng.
Phương pháp này phù hợp với khảo sát này vì nó có các ưu điểm sau:
Đảm bảo tính đại diện của mẫu, tức là kết quả khảo sát có thể áp dụng cho tổng thể dân số nghiên cứu.
Giúp giảm thiểu sai số do ngẫu nhiên.

35
Khả năng thực hiện cao, dễ dàng áp dụng trong thực tế.
Việc chọn mẫu ngẫu nhiên phân tầng trong khảo sát này được thực hiện như sau:
Chia tổng thể dân số nghiên cứu thành các tầng theo một hoặc nhiều tiêu chí phân tầng có liên quan đến biến phụ
thuộc.
Trong mỗi tầng, tiến hành chọn mẫu ngẫu nhiên đơn giản.
Với cách chọn mẫu này, kết quả khảo sát sẽ phản ánh được hành vi lựa chọn sữa bột của các bậc phụ huynh ở cả 3
thành phố, đồng thời phân tích được sự khác biệt về hành vi này giữa các tầng khác nhau.)

Quy mô mẫu:
Nghiên cứu này sử dụng phân tích nhân tố khám phá EFA. Trong đó, để phân tích nhân tố khám phá EFA cần có
mẫu ít nhất 200 quan sát (Gorsuch, 1983); theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008), các quy tắc kinh
nghiệm khác trong xác định cỡ mẫu cho phân tích EFA là thông thường số quan sát (kích thước mẫu) ít nhất bằng
4 hay 5 lần số biến quan sát; theo Hair và công sự (1998) kích cỡ mẫu ít nhất bằng 5 lần biến quan sát. Đây là cỡ
mẫu phù hợp cho nghiên cứu có sử dụng phân tích nhân tố (Comrey, 1973; Roger, 2006). Từ đó ta có công thức
xác định cỡ mẫu tối thiểu là: N = 5 * m
Trong đó:
N: là cỡ mẫu tối thiểu
m: là số lượng câu hỏi sử dụng mô hình thang đo 5 mức độ Likert trong bảng khảo sát. Trong bảng câu hỏi với
tổng cộng 34 biến quan sát để đánh giá các yếu tố ảnh hưởng đến quyết định mua hàng trên ứng dụng Shopee của
người tiêu dùng tại thành phố Hồ Chí Minh.
Theo mô hình nghiên cứu của nhóm có 34 biến quan sát, vậy nên tối thiểu cần n = 5*34=170. Để thỏa mãn điều
kiện và phòng trường hợp các mẫu không đủ tiêu chuẩn bị loại bỏ, trên thực tế có 300 mẫu đã được tiến hành điều
tra, sau khi sàng lọc đã có 277 mẫu đạt yêu cầu đề ra.

Contents
Quy trình xử lý dữ liệu...............................................................................................................................................1
Khi thu thập dữ liệu bằng bảng hỏi, các bảng câu hỏi thu về sẽ cần được kiểm tra những vấn đề gì về dữ liệu
thu được? Đề xuất giải pháp khắc phục với các trường hợp?................................................................................1
PHÂN LOẠI DỮ LIỆU..............................................................................................................................................1
CÁC LOẠI THANG ĐO............................................................................................................................................1
KHAI BÁO BIẾN VÀ NHẬP LIỆU.........................................................................................................................2
*QUY TẮC KHAI BÁO TÊN BIẾN.........................................................................................................................2
*Nhập giá trị (Cột Value):..........................................................................................................................................2
THAY ĐỔI MỘT SỐ THUỘC TÍNH MẶC ĐỊNH CỦA SPSS.............................................................................2
THỦ TỤC COMPUTE: TẠO BIẾN MỚI KHÔNG HOẶC CÓ ĐIỀU KIỆN.....................................................2
GOM BIẾN: RECODE..............................................................................................................................................3
-Recode into same variables :...................................................................................................................................3
-Recode into different variables :..............................................................................................................................3

36
THỐNG KÊ MÔ TẢ..................................................................................................................................................5
1. Bảng phân bố tần suất...........................................................................................................................................5
2. Mô tả dữ liệu (Descriptive)...................................................................................................................................5
3. Lập bảng cho biến nhiều trả lời............................................................................................................................6
4. Xử lý câu hỏi nhiều lựa chọn................................................................................................................................6
THỐNG KÊ CROSSTABS: 2 yếu tố tương quan với nhau.......................................................................................8
KIỂM TRA ĐỘ TIN CẬY CỦA THANG ĐO (Cronbach’s Alpha):....................................................................8
PHÂN TÍCH NHÂN TỐ KHÁM PHÁ EFA:...........................................................................................................9
PHÂN TÍCH TƯƠNG QUAN PEARSON.............................................................................................................11
PHÂN TÍCH HỒI QUY TUYẾN TÍNH.................................................................................................................12
KIỂM ĐỊNH GIẢ THUYẾT VỀ TRỊ TRUNG BÌNH CỦA 2 TỔNG THỂ ĐỘC LẬP (Independent Samples
T-test).........................................................................................................................................................................17
PHÂN TÍCH ONE-WAY ANOVA.........................................................................................................................19
KIỂM ĐỊNH CHI BÌNH PHƯƠNG.......................................................................................................................22
TÍNH TRỊ TRUNG BÌNH (2 CÁCH).....................................................................................................................24
KIỂM ĐỊNH PAIRED-SAMPLES T-TEST..........................................................................................................24
TẠO NHÂN TỐ ĐẠI DIỆN BẰNG TRUNG BÌNH CỘNG.................................................................................25
HỒI QUY CHO NHÓM THU NHẬP DƯỚI 3 TRIỆU........................................................................................26
CÁCH KHAI BÁO BIẾN VÀ NHẬP LIỆU TRONG SPSS.................................................................................27
BẢNG CÂU HỎI......................................................................................................................................................30
2.1. Mục tiêu nghiên cứu:.........................................................................................................................................31
4.Phương pháp nghiên cứu:.....................................................................................................................................31
PP thu thập dữ liệu...................................................................................................................................................32
3. Đối tượng và phạm vi nghiên cứu:.........................................................................................................................34
Phương pháp chọn mẫu:..........................................................................................................................................35
Quy mô mẫu:..............................................................................................................................................................36

37

Vous aimerez peut-être aussi