Mô hình xác suất tuyến tính và hàm phân biệt tuyến tính

1. Mô hình xác suất tuyến tính (LPM)

Thuật ngữ mô hình xác suất tuyến tính đuợc sử dụng cho mô hình hồi qui với biến phụ thuộc là biến phân đôi có giá trị là 1 hoặc 0. Để đơn giản, chúng ta chỉ xem xét 1 biến giải thích, x.

Bien y là biến chỉ định cho biết khi nào xảy ra hoặc không xảy ra của một sự kiện. Ví dụ khi phân tích các yếu tố quyết định đến thất nghiệp, chúng ta có dữ liệu cho mỗi cá nhân là họ có hay không có việc làm, và chúng ta có một số biến giải thích xác định trạng thái của công việc. Sự kiện đuợc xem xét ở đây là việc làm. Chúng ta định nghĩa biến phân đôi nhu sau:

Trong những năm 1960 và đầu những năm 1970, mô hình xác suất tuyến tính đ ược sử dụng một cách rộng rãi bởi vì nó là mô hình dễ ước lượng khi phân tích hồi qui bội. Một vài nhà kinh tế khác sử dụng phân tích phân biệt, phương pháp này cũng tương tự như mô hình xác suất tuyến tính. Ví dụ, Meyer và Pifer phân tích những thất

bại của các ngân hàng bằng mô hình xác suất tuyến tính và Altman phân tích sự sụp đổ của các tập đoàn sản xuất bằng phân tích biệt số.

2. Hàm phân biệt tuyến tính

Giả sử rằng chúng ta có n thông tin cá nhân, mỗi cá nhân là một quan sát gồm có k biến giải thích và chúng ta thu được nj quan sát thuộc nhóm TTi và n₂ quan sát thuộc nhóm 712 trong đó ni + n₂ = n. Chúng ta muốn xây dựng một hàm tuyến tính k biến mà chúng ta có thể dùng để dự báo một quan sát mới thuộc một trong 2 nhóm.

Hàm tuyến tính này được gọi là hàm phân biệt tuyến tính.

Ví dụ, giả sử rằng chúng ta có dữ liệu về một số người nộp đơn xin vay và chúng ta biết rằng nj trong số đó được vay và n₂ còn lại không vay được. Chúng ta cũng có những thông tin về đặc tính kinh tế xã hội của những người xin vay. Bây giờ cho trước một quan sát với một người xin vay mới với những đặc tính kinh tế xã hội cụ thể, chúng ta muốn dự báo người xin vay đó sẽ nhận được khoản vay hay không.

Chúng ta định nghĩa hàm tuyến tính:

Như vậy, một lần nữa chúng ta có các hệ số hồi qui và tổng bình phương các phần dư từ hồi qui biến phụ thuộc là biến giả, chúng ta có thể rất dễ dàng tìm được các hệ số của hàm biệt số.

Mô hình xác suất tuyến tính chỉ khác một chút so với công thức của Fisher. Trong mô hình xác suất tuyến tính, chúng ta định nghĩa: