Hệ số tương quan (r) là một chỉ số thống kê đo lường mối liên hệ tương quan giữa hai biến số, như giữa MỨC ĐỘ HÀI LÒNG (y) và TIỀN LƯƠNG (x). Hệ số tương quan có giá trị từ -1 đến 1. Hệ số tương quan bằng 0 (hay gần 0) có nghĩa là hai biến số không có liên hệ gì với nhau; ngược lại nếu hệ số bằng -1 hay 1 có nghĩa là hai biến số có một mối liên hệ tuyệt đối. Nếu giá trị của hệ số tương quan là âm (r <0) có nghĩa là khi x tăng cao thì y giảm (và ngược lại, khi x giảm thì y tăng); nếu giá trị hệ số tương quan là dương (r > 0) có nghĩa là khi x tăng cao thì y cũng tăng, và khi x tăng cao thì y cũng tăng theo.
Có nhiều hệ số tương quan, hệ số tương quan thông dụng nhất: hệ số tương quan Pearson r, được định nghĩa như sau: Cho hai biến số x và y từ n mẫu, hệ số tương quan Pearson được ước tính bằng công thức sau đây:
Trong phân tích áp dụng cho luận văn, kiểm định hệ số tương quan Pearson dùng để kiểm tra mối liên hệ tuyến tính giữa các biến độc lập và biến phụ thuộc. Nếu các biến độc lập với nhau có tương quan chặt thì phải lưu ý đến vấn đề đa cộng tuyến khi phân tích hồi quy (giả thuyết H0: hệ số tương quan bằng 0). Cụ thể cách chạy như sau:
Vào menu Analyze-> Correlate -> Bivariate
Chọn các nhân tố vừa được tạo ở bước trên qua ô Variables bên phải. Xong bấm OK
Cách đọc ý nghĩa phân tích tương quan:
-Ô màu xanh: hệ số tương quan Pearson
-Ô màu đỏ: significant của kiểm định Pearson. Giả thuyết H0: hệ số tương quan bằng 0. Do đó nếu Sig. này bé hơn 5% ta có thể kết luận được là hai biến có tương quan với nhau. Hệ số tương quan càng lớn tương quan càng chặt. nếu Sig. này lớn hơn 5% thì hai biến không có tương quan với nhau.
-Vì một trong những điều kiện cần để phân tích hồi quy là biến độc lập phải có tương quan với biến phụ thuộc, nên nếu ở bước phân tích tương quan này biến độc lập không có tương quan với biến phụ thuộc thì ta loại biến độc lập này ra khỏi phân tích hồi quy.
-Kết quả phân tích tương quan Pearson cho thấy một số biến độc lập có sự tương quan với nhau. Do đó khi phân tích hồi quy cần phải chú ý đến vấn đề đa cộng tuyến. Các biến độc lập có tương quan với biến phụ thuộc và do đó sẽ được đưa vào mô hình để giải thích cho biến phụ thuộc.