Phân tích số liệu thống kê trong nghiên cứu định lượng là một phần rất quan trọng, nó giúp chúng ta khái quát được các đặc trưng của mẫu, giúp xác định được ý nghĩa thống kê của các số liệu. Có thể nói đây là phần thể hiện rõ nhất giá trị khoa học của một nghiên cứu định lượng. Tuy nhiên đây cũng là một vấn đề khá phức tạp, nhất là với những cán bộ y tế không chuyên về nghiên cứu khoa học như chúng ta. Trong quá trình tìm hiểu, chúng tôi có hệ thống lại một số vấn đề cơ bản thường gặp về phân tích số liệu thống kê. Chúng tôi nêu ra đây mong có thể giúp được một số đồng nghiệp trong công việc cũng như rất mong nhận được sự trao đổi, góp ý của các anh chị.
A. PHÂN LOẠI PHÂN TÍCH THỐNG KÊ
Sau khi đã thu thập, xữ lý và quản lý số liệu, chúng ta tiến hành phân tích số liệu. Có nhiều cách phân tích tùy theo thiết kế nghiên cứu, nhưng nói chung việc phân tích số liệu thống kê thường có ba dạng, đó là:
– Phân tích thống kê để mô tả 1 biến số.
– Phân tích thống kê để tìm tương quan giữa hai biến số.
– Phân tích thống kê để so sánh giữa các biến số.
Trong một Thiết kế nghiên cứu có thể sử dụng 1, 2 hay cả 3 dạng phân tích trên.
1. Thống kê mô tả 1 biến số thường dùng để mô tả các biến số về yếu tố xã hội, dân số (giới tính, tuổi, trình độ học vấn, nghề nghiệp); các biến số về tiếp cận dịch vụ xã hội, y tế (khoảng cách từ nhà đến bệnh viện, trình trạng tiếp cận với các phương tiện truyền thông…) của mẫu nghiên cứu. Thống kê này thường được dùng trong thiết kế nghiên cứu mô tả, nghiên cứu cắt ngang. Tuy nhiên, hầu hết các thiết kế nghiên cứu y tế thường có phần này để mô tả các đặc điểm của đối tượng nghiên cứu.
2. Thống kê tìm mối liên quan cho biết mối liên hệ giữa các biến số của mẫu nghiên cứu sau khi thu thập được như thế nào. Thống kê này thường được dùng trong thiết kế nghiên cứu cắt ngang…
3. Thống kê so sánh thường có 3 dạng:
a. So sánh với một số liệu sẵn có: Một tỷ lệ hay một giá trị trung bình sẽ được so sánh với một tỷ lệ hay một giá trị trung bình có từ một nghiên cứu khác hay là một giá trị lý thuyết. Dạng thống kê so sánh này thường dùng trong thiết kế nghiên cứu giả thực nghiệm đánh giá sau can thiệp, nghiên cứu cắt ngang.
b. So sánh trước-sau: Một tỷ lệ hay một giá trị trung bình tính được sau can thiệp sẽ được so sánh với một tỷ lệ hay một giá trị trung bình trước can thiệp. Dạng thống kê so sánh này thường dùng trong thiết kế nghiên cứu giả thực nghiệm đánh giá trước – sau can thiệp.
c. So sánh giữa các nhóm trong cùng một mẫu nghiên cứu: Một tỷ lệ hay một giá trị trung bình của một nhóm sẽ được so sánh với một (hoặc 2,3…) tỷ lệ hay một (hoặc 2,3…) giá trị trung bình của một nhóm khác trong cùng một mẫu nghiên cứu. Dạng thống kê so sánh này thường dùng trong thiết kế nghiên cứu Thuần tập, nghiên cứu bệnh – chứng và nghiên cứu cắt ngang.
B. LỰA CHỌN THỐNG KÊ CƠ BẢN VÀ TEST KIỂM ĐỊNH THỐNG KÊ.
Việc lựa chọn các thống kê cơ bản và loại test kiểm định thống kê dựa vào dạng thống kê (mô tả, tương quan, so sánh) và tính chất của biến. Nếu là biến phân loại ta phân tích tỷ lệ, biến liên tục phân phối chuẩn ta phân tích giá trị trung bình và trường hợp biến liên tục không phân phối chuẩn ta phân tích giá trị trung vị.
I. Thống kê mô tả: Phân tích cho một biến.
1. Phân tích mô tả một biến phân loại: Tính các tần số, tỷ lệ và trình bày bằng biểu đồ cột rời hoặc biểu đồ hình bánh.
2. Phân tích mô tả một biến liên tục:
a. Phân phối chuẩn: Mô tả bằng giá trị trung bình và độ lệch chuẩn (sd). Trình bày bằng biểu đồ cột liền.
b. Không phải phân phối chuẩn: Mô tả bằng giá trị trung vị và độ phân tán thống kê (khoảng). Trình bày bằng biểu đồ BOX-AND-WHISKER.
II. Thống kê tìm mối liên quan.
1. Mối liên quan giữa một biến liên tục và một biến phân loại. Trình bày bằng số (giá trị trung bình hay trung vị) trong từng phân nhóm và bằng biểu đồ Boxplot.
2. Mối liên quan giữa hai biến phân loại. Tính giá trị trung bình và độ lệch chuẩn và trình bày bằng bảng.
3. Mối liên quan giữa hai biến liên tục.
a. Cả 2 biến đều có phân phối chuẩn: Trình bày mối liên quan bằng biểu đồ chấm điểm để định hướng và Kiểm định bằng hệ số tương quan Pearsons hoặc Hồi quy tuyến tính.
b. Có một biến hoặc cả 2 biến đều không có phân phối chuẩn: Trình bày mối liên quan bằng biểu đồ chấm điểm để định hướng và Kiểm định bằng hệ số tương quan Spearman.
III. Thống kê so sánh.
1. So sánh với một số liệu sẵn có. (Kiểm định tính phù hợp)
a. So sánh một giá trị trung bình với một giá trị trung bình đã có:
Kiểm định bằng tets t một mẫu.
b. So sánh một tỷ lệ với một tỷ lệ đã có: Kiểm định bằng tets khi bình phương một mẫu.
2. So sánh trước sau trên cùng một mẫu nghiên cứu. (Kiểm định tính đồng nhất)
a. So sánh hai giá trị trung bình: Kiểm định bằng tets t ghép cặp.
b. So sánh 2 tỷ lệ: Kiểm định bằng tets khi bình phương McNemar
c. So sánh hai giá trị trung vị:
+ Nếu biến có phân phối chuẩn: Kiểm định bằng tets t ghép cặp.
+ Nếu biến không có phân phối chuẩn: Chọn kiểm định phi tham số Wilcoxon.
3. So sánh giữa các nhóm trong cùng một thời gian trên một mẫu nghiên cứu. (Kiểm định tính độc lập). Khác với các so sánh trên, so sánh này có thể là so sánh giữa 2 hay nhiều hơn 2 nhóm.
a. So sánh các giá trị trung bình:
+ So sánh hai giá trị trung bình: Kiểm định bằng tets t không ghép cặp.
+ So sánh nhiều hơn hai giá trị trung bình: Kiểm định bằng tets ANOVA một chiều.
b. So sánh giửa các tỷ lệ:
+ So sánh 2 tỷ lệ: Tính tỷ suất chênh OR và kiểm định bằng tets khi bình phương một phía.
+ So sánh nhiều hơn 2 tỷ lệ: Kiểm định bằng tets khi bình phương hai phía.
c. So sánh các trung vị:
* So sánh hai trung vị:
+ Nếu biến có phân phối chuẩn: Kiểm định bằng tets t không ghép cặp.
+ Nếu biến không có phân phối chuẩn: Chọn kiểm định Mann-Whitney.
* So sánh nhiều hơn hai trung vị:
+ Nếu biến có phân phối chuẩn: Chọn kiểm định ANOVA một chiều.
+ Nếu biến không có phân phối chuẩn: Chọn kiểm định ANOVA Kruskal-Wallis.
Chúng ta có thể sử dụng phần mềm SPSS để thực hiện các phân tích trên. Đây là một phần mềm miễn phí được sử dụng rộng rãi trong các nghiên cứu xã hội học nói chung cũng như nghiên cứu y học nói riêng.