Hướng dẫn thực hành phân tích hồi quy nhị phân binary logistic

Về mô hình: đây là mô hình xác định khả năng trả nợ dựa vào  6 yếu tố độc lập.

Mô hình có 6 biến độc lập:

THUNHAP, TUOI, TAISAN, DIENTICHDAT, HOCVAN, SOLUONGBATDONGSAN

Và 1 biến phụ thuộc là TRANO.

Biến phụ thuộc dạng nhị phân có hai giá trị 0 và 1 tương ứng với không trả được nợ và trả được nợ.

Khi chạy ra các kết quả sau:

-Omnibus Tests of Model Coefficients: Giống kiểm định F bên hồi quy đa biến, sig<5% nên bác bỏ giả thiết Ho: B1=B2=B3…=0

Omnibus Tests of Model Coefficients
    Chi-square df Sig.
Step 1 Step 107.435 6 0
Block 107.435 6 0
Model 107.435 6 0

Bảng Model Summary

Model Summary
Step -2 Log likelihood Cox & Snell R Square Nagelkerke R Square
1 129.147a .466 .623
 

Chỉ số -2 Log  likelihood: càng nhỏ càng tốt,cách tính ngược lại với R bình phương của hồi quy đa biến. Nếu nhỏ thì thể hiện độ phù hợp khá tốt của mô hình tổng thể

Bảng Classification Table cho thấy phân loại đối tượng trả được nợ và không trả được nợ theo hai tiêu chí : quan sát thực tế và dự đoán

Classification Tablea
  Observed Predicted
  TRANO Percentage Correct
  0 1
Step 1 TRANO 0 76 14 84.4
1 19 62 76.5
Overall Percentage     80.7
a. The cut value is
.500
     

Ý nghĩa:

Trong 90 trường hợp quan sát ko trả được nợ, thì dự đoán có 76 trường hợp không trả được, vậy tỉ lệ dự đoán đúng là 76/90=84.4

Trong 81 trường hợp quan sát trả được nợ, dự đoán có 62 trường hợp trả được, vậy tỉ lệ dự đoán đúng là 62/81=76.5

Vậy trung bình dự đoán đúng (76+62)/(76+62+14+19)=138/171=80.7 phần trăm

Variables in the Equation
    B S.E. Wald Df Sig. Exp(B)
Step 1a THUNHAP 0.269 0.087 9.568 1 0.002 1.309
TUOI 0.049 0.017 8.285 1 0.004 1.05
TAISAN 0.006 0.002 5.536 1 0.019 1.006
DIENTICHDAT 0.001 0 7.974 1 0.005 1.001
HOCVAN 1.139 0.378 9.063 1 0.003 3.124
SOLUONGBATDONGSAN 1.024 0.304 11.329 1 0.001 2.785
Constant -18.937 2.978 40.445 1 0 0
a. Variable(s) entered
on step 1: THUNHAP, TUOI, TAISAN, DIENTICHDAT, HOCVAN, SOLUONGBATDONGSAN.
 

Kiểm định Wald có mục đích, ý nghĩa sau
– Trong  hồi quy đa biến, giá trị t được sử dụng để đánh giá tầm quan trọng của mỗi hệ số. Trong hồi quy logistic sử dụng một dạng thống kê khác nhau, đó là thống kê Wald. Nó cung cấp mức ý nghĩa thống kê đối với từng hệ số ước lượng để kiểm tra giả thuyết , tương tự hồi quy đa biến.
– Ý nghĩa giải thích của kiểm định Wald trong hồi quy nhị phân giống như giá trị t sử dụng để kiểm định mức ý nghĩa của các hệ số hồi quy trong hồi quy đa biến thông thường.

Ví dụ một người có các thông tin cá nhân như sau, ta sẽ dùng kết quả phương trình hồi quy để dự đoán khả năng trả nợ:

THUNHAP TUOI TAISAN DIENTICHDAT HOCVAN SOLUONGBATDONGSAN
13.5 56 493 4,011 4 3

Hàm xác suất trả nợ

Thế vào, kết quả E(Y/X)= 4.90/5.90=0.83

Kết luận, khả năng trả nợ của người này là 83%, và đây là khả năng trả nợ dự đoán, và dự đoán này đúng 80.7%