Thực hành cách phân tích hồi quy đa biến
Để chạy hồi quy đa biến: vào menu Analyze->Regression-> Linear.
Chọn nhân tố độc lập và phụ thuộc vào các ô bên phải. Cụ thể bài ví dụ này có 6 nhân tố độc lập TINCAY, DAPUNG, DAMBAO, CAMTHONG, HUUHINH, MINHBACH sẽ được đưa vào ô Independent(s) và 1 nhân tố phụ thuộc HAILONG sẽ được đưa vào ô Dependent. ( đưa vào ô bằng cách bấm chọn biến và ấn nút mũi tên)
Xong bấm vào Statistics chọn Collinearity diagnostics ( để tính ra hệ số VIF – hệ số phóng đại phương sai- để đánh giá hiện tượng đa cộng tuyến)
Xong bấm OK, kết quả sẽ ra như sau:
Cách giải thích kết quả hồi quy đa biến SPSS
Nhìn vào Bảng 1 hình trên, dùng để đánh giá độ phù hợp của mô hình hồi quy đa biến, hệ số R bình phương hiệu chỉnh Adjusted R Square là 0.609. Nghĩa là 60.9% biến thiên của biến phụ thuộc HÀI LÒNG được giải thích bởi 6 nhân tố độc lập. Điều này cho thấy mô hình hồi quy tuyến tính này phù hợp với tập dữ liệu của mẫu ở mức 60.9%, tức là các biến độc lập giải thích được 60.9% biến thiên của biến phụ thuộc sự HÀI LÒNG.
Nhìn vào Bảng 2 hình trên, kiểm định giả thuyết về độ phù hợp với tổng thể của mô hình, giá trị F=26.746 với sig.=0.000 <5%. Chứng tỏ R bình phương của tổng thể khác 0. Đồng nghĩa với việc mô hình hồi quy tuyến tính xây dựng được là phù hợp với tổng thể (chi tiết hơn là R bình phương tổng thể ta không thể tính cụ thể được, nhưng ta biết chắc chắn sẽ khác 0, mà khác 0 thì chứng tỏ là các biến độc lập có tác động đến biến phụ thuộc)
Nhìn vào Bảng 3 hình trên, kiểm định các giả thuyết sử dụng phần mềm SPSS: cái giá trị ở cột Sig. đều <5% chứng tỏ 6 biến độc lập đều tác động có ý nghĩa thống kê đến biến phụ thuộc. Nghĩa là 6 giả thiết đều được chấp nhận. Nhìn vào hệ số B có thể giải thích như sau, ví dụ hệ số B của TINCAY là 0.215 , nghĩa là khi biến TINCẬY tăng 1 đơn vị thì biến HÀILÒNG tăng 0.215 đơn vị. Ngoài ra có thể so sánh xác định mức độ ảnh hưởng của các yếu tố: yếu tố có hệ số B càng lớn thì có thể nhận xét rằng yếu tố đó có mức độ ảnh hưởng cao hơn các yếu tố khác trong mô hình nghiên cứu. Lưu ý giả sử có biến nào có sig. tương ứng lớn hơn 5% thì biến đó không có tác động đến biến phụ thuộc nhé.
Kiểm tra giả định về hiện tượng đa cộng tuyến (tương quan giữa các biến độc lập) thông qua giá trị của độ chấp nhận (Tolerance) hoặc hệ số phóng đại phương sai VIF (Variance inflation factor): VIF > 10 thì có thể nhận xét có hiện tượng đa cộng tuyến (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2005). Thực tế thường so sánh VIF với 2. Trong bài này hệ số phóng đại phương sai VIF đều bé hơn 2, chứng tỏ không có hiện tượng đa cộng tuyến. ( lưu ý mối quan hệ giữa Tolerance và VIF là nghịch đảo của nhau như sau: VIF=1/Tolerance nên chỉ cần đánh giá một trong hai giá trị này là được)
Như vậy phần phân tích hồi quy SPSS cơ bản đã xong. Dưới đây là phần nâng cao
Phần nâng cao: kiểm tra các giả định hồi quy
Mô hình hồi quy tuyến tính bằng phương pháp OSL được thực hiện với một số giả định và mô hình chỉ thực sự có ý nghĩa khi các giả định này được đảm bảo. Do vậy để đảm bảo cho độ tin cậy của mô hình, việc dò tìm sự vi phạm các giả định là cần thiết. Giả định đa cộng tuyến đã đề cập ở trên, phần này sẽ làm về giả định phân phối chuẩn của phần dư và giả định liên hệ tuyến tính.
Trong bảng hồi quy, nhấn vào nút Plots như hình bên dưới. Đưa giá trị *zresid vào ô Y, *zpred vào ô X để ra được biểu đồ *zresid by *zpred Scatterplot. Check vào Histogram và Normal Probability Plot để ra được biểu đồ Histogram và Normal P-P Plot
Kết quả hồi quy sẽ có thêm 3 biểu đồ sau.
1. Biều đồ histogram: giả định phân phối chuẩn của phần dư
Nhìn vào đây ta thấy phần dư chuẩn hóa phân bố theo hình dạng của phân phối chuẩn. Có một đường cong hình chuông trên hình là đường phân phối chuẩn, ta thấy biểu đồ tần số histogram tương ứng với đường cong hình chuông đó. Thêm nữa, giá trị trung bình mean là -1.15E-15 xấp xỉ =0, và độ lệch chuẩn bằng 0.969 xấp xỉ =1 càng khẳng định thêm phần dư chuẩn hóa tuân theo phân phối chuẩn. (Lưu ý về mặt lý thuyết, phân phối chuẩn là phân phối có trung bình =0 và phương sai bằng 1)
2. Biều đồ Normal P-P Plot of Regression Standardized Residual : giả định phân phối chuẩn của phần dư
Xem biểu đồ Normal P-P Plot bên dưới, các trị số quan sát và trị số mong đợi đều nằm gần trên đường chéo chứng tỏ phần dư chuẩn hóa có phân phối chuẩn. Kiểm định bằng Biểu đồ P- P Plot thể hiện những giá trị của các điểm phân vị của phân phối của biến theo các phân vị của phân phối chuẩn. Quan sát mức độ các điểm thực tế, tập trung sát đường thẳng kỳ vọng, cho thấy tập dữ liệu nghiên cứu là tốt, phần dư chuẩn hóa có phân phối gần sát phân phối chuẩn
3. Biều đồ Scatterplot :giả định liên hệ tuyến tính
Về giả định liên hệ tuyến tính, phương pháp được sử dụng là biểu đồ phân tán Scatterplot. Nhìn vào biểu đồ ta thấy phần dư chuẩn hóa (Regression Standardized Residual) không thay đổi theo một trật tự nào đối với giá trị dự đoán chuẩn hóa (Regression Standardized Predicted Value). Do đó giả định về liên hệ tuyến tính không bị vi phạm. Điều này có nghĩa là như thế này: giá trị dự đoán chuẩn hóa chính là giá trị chuẩn hóa của biến phụ thuộc, còn phần dư chuẩn hóa là giá trị chuẩn hóa của phần dư. Ta thấy biến phụ thuộc không có liên hệ gì với lại phần dư.
Các ghi chú cần thiết cho việc chạy hồi quy SPSS
Các nhân tố được trích ra trong phân tích nhân tố được sử dụng cho phân tích hồi quy đa biến để kiểm định mô hình nghiên cứu và các giả thuyết kèm theo. Các kiểm định giả thuyết thống kê đều áp dụng mức ý nghĩa là 5%.
Trước khi phân tích hồi quy phải phân tích tương quan. Sau khi kết luận là hai biến có mối liên hệ tuyến tính thì có thể mô hình hóa mối quan hệ nhân quả của hai biến này bằng hồi quy tuyến tính (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2005).
Nghiên cứu thực hiện hồi quy đa biến theo phương pháp Enter: tất cả các biến được đưa vào một lần và xem xét các kết quả thống kê liên quan.