Đa cộng tuyến là hiện tượng các biến độc lập có mối tương quan rất mạnh với nhau. Mô hình hồi quy xảy ra hiện tượng đa cộng tuyến sẽ khiến nhiều chỉ số bị sai lệch, dẫn đến kết quả của việc phân tích định lượng không còn mang lại nhiều ý nghĩa. Bài viết này chúng ta sẽ cùng đi vào tìm hiểu nguyên nhân, dấu hiệu nhận biết và cách khắc phục hiện tượng đa cộng tuyến.
1. Nguyên nhân gây ra đa cộng tuyến
- Do khi lập bảng khảo sát, chúng ta xây dựng nên các nhân tố không khác biệt nhau nhiều về tính chất, ý nghĩa. Ví dụ: Tiền lương và Thu nhập/ Sở thích và Điều quan tâm…
- Do đặc trưng của chính môi trường được khảo sát gây nên hiện tượng đa cộng tuyến. Cùng một bảng khảo sát nhưng có thể mở môi trường khảo sát số 1 không có đa cộng tuyến xảy ra nhưng ở môi trường số 2 lại có đa cộng tuyến. Bởi vì đặc điểm môi trường khảo sát số 2 có điểm khác biệt rất nhiều so với môi trường 1. Tại môi trường số 2, các nhóm nhân tố dù ban đầu khi lập cơ sở lý luận thì chúng không có mối tương quan quá cao nhưng ở môi trường này giữa chúng lại có sự tương quan mạnh, điều này dẫn đến đa cộng tuyến khi thu thập dữ liệu khảo sát. Chính vì vậy, ở mỗi môi trường đặc trưng, bạn cần điều chỉnh bảng khảo sát cho hợp lý.
Dữ liệu sau thu thập vô tình vượt qua được kiểm định tính phân biệt trong EFA nhưng khi thực hiện phân tích hồi quy đa biến, đa cộng tuyến được biểu hiện ra thông qua hệ số VIF.
2. Dấu hiệu nhận biết hiện tượng đa cộng tuyến


3. Cách khắc phục hiện tượng đa cộng tuyến
– Giải pháp 1: Loại bỏ biến độc lập có hệ số VIF vượt qua giá trị tiêu chuẩn. Bạn nên bỏ biến có VIF lớn nhất rồi chạy lại phân tích hồi quy xem thử có còn hiện tượng đa cộng tuyến hay không. Trong ví dụ ở trên, tác giả loại bỏ nhân tố TN (VIF = 5.179) thì khi chạy lại hồi quy không còn hiện tượng đa cộng tuyến.
– Giải pháp 2: Có thể đa cộng tuyến xảy ra do cỡ mẫu thu thập nhỏ. Bạn hãy thử thu thập thêm phiếu trả lời để tăng cỡ mẫu lên khoảng gấp 1,5 đến 2 lần. Khi cỡ mẫu lớn hơn sẽ làm giảm phương sai và ý nghĩa các kiểm định cũng sẽ có giá trị hơn.
– Giải pháp 3: Nếu vấn đề xuất phát từ chính bước chọn mô hình nghiên cứu và lập bảng khảo sát. Bạn có thể sẽ phải hủy bỏ dữ liệu thu thập và điều chỉnh lại mô hình, tiến hành khảo sát lại. Cho nên, bước lập cơ sở lý luận để đưa ra mô hình đề xuất và bảng khảo sát là rất quan trọng, các bạn nên làm cho thật tốt phần này qua sự hướng dẫn của giảng viên, những người có chuyên môn.
Trên đây là bài hướng dẫn về nguyên nhân, cách nhận biết cũng như hướng khắc phục khi xảy ra hiện tượng đa cộng tuyến. Các bạn thấy hữu ích nhớ Like & Share giúp mình nhé.
——–
Nếu bạn gặp khó khăn khi thực hiện phân tích hồi quy đa biến vì mô hình xảy ra đa cộng tuyến, bạn có thể tham khảo dịch vụ phân tích SPSS của mình ở đây hoặc liên hệ trực tiếp email phamlocblog@gmail.com. Dịch vụ mình cung cấp giúp bạn khắc phục được hiện tượng đa cộng tuyến, làm cho mô hình tốt hơn, đáp ứng các tiêu chuẩn kiểm định và giả định hồi quy.