So sánh hồi quy và tương quan

So sánh hồi quy và tương quan

Trước mắt nói về khái niệm tương quan. Khi chạy mô hình hồi quy, câu hỏi đặt ra là có cần tương quan hay không? Tuy nhiên mình cần phân biệt là tương quan giữa biến nào với biến nào, vì nhiều bạn cứ nói tương quan chung chung mà ko xác định cụ thể.

  1. So sánh tương quan giữa hai biến độc lập với nhau: nếu không có tương quan thì càng tốt, còn nếu có tương quan thì khi vào hồi quy phải lưu ý xem có hiện tượng đa cộng tuyến giữa hai biến đó hay không?
  2. So sánh tương quan giữa 1 biến độc lập và 1 biến phụ thuộc: bắc buộc phải có tương quan với nhau, nghĩa là biến độc lập phải tương quan với biến phụ thuộc thì mới đưa biến độc lập đó vào hồi quy để chạy mô hình.

Tương quan chỉ xét quan hệ giữa hai biến, trong khi đó hồi quy thường xét phương trình gồm nhiều biến độc lập và 1 biến phụ thuộc, là sự tác động đồng thời của nhiều biến lên 1 biến

Hồi quy và tương quan khác nhau về mục đích và kỹ thuật. Phân tích tương quan trước hết là đo mức độ kết hợp tuyến tính giữa các biến. Ví dụ: mức độ quan hệ giữa nghiện thuốc là và ung thư phổi, giữa kết quả thi môn Lý và môn Toán… Nhưng phân tích hồi quy lại ước lượng hoặc dự báo một biến (biến phụ thuộc) trên cơ sở giá trị đã cho của các biến khác (biến độc lập).

Tóm lại, hồi quy thì tương quan (hay nói cách khác điều kiện để chạy hồi quy thì trước hết biến độc lập và phụ thuộc phải tương quan), còn biến độc lập và phụ thuộc có tương quan với nhau thì chưa chắc kết quả hồi quy có ý nghĩa thống kê.

Tương quan không có khái niệm độc lập và phụ thuộc. Hồi quy thì có, quan hệ nhân quả, mối quan hệ đó đã được xác định trước cái nào là nhân cái nào là quả.