Crosstabs – Thực hành cách phân tích bảng chéo Crosstabs trong SPSS

Phân tích crosstabs này rất hữu ích trong việc xác định mối quan hệ, số lượng biến quan sát giữa các biến định tính, hoặc định lượng với nhau.

Cách thức tiến hành phân tích bảng chéo (crosstabulation)

Phân tích bảng chéo dùng để kiểm định mối quan hệ giữa các biến định tính với nhau bằng cách dùng kiểm định Chi – bình phương (Chi-square). Cách thức tiến hành với SPSS như sau:

Minh họa bằng hình ảnh

Vào menu Analyze -> Descriptive Statistics -> Crosstabs…

Xuất hiện hộp thoại sau:

Chọn và đưa các biến vào khung Row(s) (dòng) và Column(s) (cột) và Layer 1 of 1 (đối với trường hợp trên 2 biến).

Click vào ô Statistics, xuất hiện hộp thoại sau:

Chọn các kiểm định cần thiết. Trong trường hợp này ta dùng kiểm định Chi – bình phương (Chi-square).

  • Các kiểm định ở khung Norminal dùng để kiểm định mối liên hệ giữa các biến định danh.
  • Các kiểm định ở khung Ordinal dùng để kiểm định mối liên hệ giữa các biến thứ tự.

Click vào continue để trở lại hộp thoại Crosstabs và Click vào ô Cells, hộp thoại sau xuất hiện:

Ở ô Counts chọn Observed (thể hiện tần số quan sát). Trong trường hợp muốn thể hiện tần số mong đợi chọn Expected.

Chọn cách thể hiện phần trăm theo dòng hay theo cột ở ô Percentages.

Click Continue để trở lại hộp thoại Crosstabs và Ok để thực hiện lệnh.

CÁCH ĐỌC KẾT QUẢ KIỂM ĐỊNH

Khi thực hiện kiểm định, ta có 2 giả thuyết.

H0: không có mối quan hệ giữa các biến.

H1: có mối quan hệ giữa các biến.

Để kết luận là chấp nhận hay bác bỏ giả thuyết H0, ta sẽ dùng các kiểm định phù hợp.

Dựa vào giá trị P (p-value) (SPSS viết tắt p-value là sig.) để kết luận là chấp nhận hay bác bỏ giả thuyết H0

p-value (sig.) ≤ α (mức ý nghĩa) là bác bỏ giả thuyết H0. Có nghĩa là có mối quan hệ có ý nghĩa giữa các biến cần kiểm định.

p-value (sig.) > α (mức ý nghĩa) à chấp nhận H0. Không có mối quan hệ giữa các biến cần kiểm định.

Mức ý nghĩa thông dụng nhất là 5% hay là 0.05

ĐỐI VỚI KIỂM ĐỊNH CHI – BÌNH PHƯƠNG

Hàng đầu tiên của bảng Chi-square tests thể hiện giá trị P, ở đây là 0.039. Giá trị này bé hơn 5% nên ta kết luận là hai biến này có mối liên hệ với nhau

Chi-Square Tests
Value df
p-value

Asymp. Sig. (2-sided)

Pearson Chi-Square 16.217a 8 .039
Likelihood Ratio 18.708 8 .017
Linear-by-Linear Association .202 1 .653
N of Valid Cases 511
a. 8 cells (44.4%) have expected count less than 5. The minimum expected count is 1.69.

Cuối bảng Chi-Square tests SPSS sẽ đưa ra dòng thông báo cho biết % số ô có tần suất mong đợi dưới 5. Kiểm định Chi-bình phương chỉ có ý nghĩa khi số quan sát đủ lớn, nếu có quá 20% số ô trong bảng chéo có tần số lý thuyết nhỏ hơn 5 thì giá trị chi-bình phương không còn đáng tin cậy.

Trong ví dụ trên có đến 44.4% số ô có tần số mong đợi dưới 5, biện pháp cho trường hợp này là ta sẽ gom các biểu hiện trên các biến lại để tăng số quan sát trong mỗi nhóm.