Độ lệch chuẩn bao nhiêu thì chấp nhận được?

Độ lệch chuẩn (Standard Deviation) hay độ lệch tiêu chuẩn là một chỉ số dùng để đo mức độ phân tán của một tập dữ liệu quanh giá trị trung bình (Mean). Trong các phần mềm thống kê, độ lệch chuẩn thường được ký hiệu là hoặc S.D hoặc Std. Deviation.

Khi thực hiện thống kê mô tả, chúng ta thường thấy xuất hiện giá trị độ lệch chuẩn ở phần bảng output. Vậy thì độ lệch chuẩn ở mức bao nhiêu thì chấp nhận, bao nhiêu thì không chấp nhận? Trước tiên, chúng ta cần hiểu được bản chất của độ lệch chuẩn. Độ lệch chuẩn được tính bằng cách lấy căn bậc hai của phương sai, nó biểu thị sự dao động của dữ liệu quanh giá trị trung bình là rộng hay hẹp. Nếu độ lệch chuẩn cao, đồ thị scatter biểu diễn các điểm giá trị sẽ phân tán ra xa; nếu độ lệch chuẩn thấp, các điểm giá trị sẽ phân bố tập trung quanh đường trung bình.

Lúc này chúng ta có đại lượng CV là hệ số dao động dữ liệu (Coefficient of Variation).

CV = (S.D/Mean)

– Nếu CV > 1, độ lệch chuẩn lớn hơn trung bình, điều này chỉ ra rằng dữ liệu dao động rất mạnh, con số trả lời của đáp viên ở biến đó chênh lệch nhau rất nhiều. Ví dụ: một câu hỏi được đo bằng Likert 1-5, thì cùng một câu hỏi đó nhiều người chọn 1,2 và nhiều người chọn 4,5. Chênh lệch điểm trả lời khá lớn, dẫn đến độ lệch chuẩn cao.

– Nếu CV < 1, độ lệch chuẩn nhỏ hơn trung bình, dữ liệu dao động trung bình yếu, con số trả lời của đáp viên chênh lệch thấp. Ví dụ: một câu hỏi được đo bằng Likert 1-5, thì cùng một câu hỏi đó phần lớn đáp viên đều chọn xoay quanh 1,2,3 hoặc xoay quanh 4,5 hoặc xoay quanh 3,4. Sự chênh lệch điểm đánh giá là không cao.

Quay lại với câu hỏi: Độ lệch chuẩn ở mức bao nhiêu thì chấp nhận được? Câu trả lời là không có ngưỡng nào là chấp nhận hay không chấp nhận. Hay nói cách khác, độ lệch chuẩn không có khái niệm là tốt hay xấu. Giá trị này chỉ chỉ ra cho bạn thấy mức độ dàn trải của dữ liệu là ít hay nhiều. Còn đánh giá là tốt hay xấu nó sẽ phụ thuộc vào sự kỳ vọng của bạn. Lấy ví dụ một câu hỏi đo theo Likert 5 mức độ đồng ý.

Với câu hỏi đó, bạn kỳ vọng sự ổn định từ đáp án người trả lời, bạn hy vọng rằng đáp viên sẽ cho điểm rơi nhiều vào 3,4,5 (nhánh đồng ý) thay vì tỷ lệ chọn 1,2,3,4,5 ngang nhau không rõ ràng. Lúc này cùng 1 câu hỏi, cùng một nhóm đối tượng, các thông tin nhân khẩu học khá tương đồng nhau, nhưng người A cho điểm rất cao, người B lại cho điểm rất thấp. Điều này dẫn đến độ lệch chuẩn của câu hỏi cao, khác xa với kỳ vọng của bạn hoặc lý thuyết bạn nghiên cứu, do đó độ lệch chuẩn cao trong trường hợp này là xấu.
Cũng với câu hỏi đó, bạn muốn xem xét sự khác nhau về hành vi của đáp viên do họ có đặc điểm nhân khẩu học khác nhau. Bạn kỳ vọng đáp án sẽ có sự chênh lệch mạnh (sự kỳ vọng này đến từ lý thuyết hoặc nghiên cứu định tính bạn đã làm trước đó) để có sự khác biệt hành vi của đáp viên với các đặc điểm nhân khẩu học khác nhau dựa trên các thông tin bạn đã thu thập được. Nhưng lúc này đáp viên chỉ trả lời thiên về một nhánh toàn 3,4,5, mức điểm đều đều. Trường hợp này, độ lệch chuẩn thấp khác xa với kỳ vọng, nó là xấu.