Phân tích nhân tố khám phá EFA trong SPSS

Phân tích nhân tố khám phá EFA là một bước rất quan trọng khi thực hiện phân tích dữ liệu định lượng bằng SPSS trong một bài luận văn, bài nghiên cứu khoa học. Khi kiểm định một lý thuyết khoa học, chúng ta cần đánh giá độ tin cậy của thang đo (phân tích Cronbach Alpha) và giá trị của thang đo (EFA). Ở phần trước, chúng ta đã tìm hiểu về độ tin cậy thang đo, vấn đề tiếp theo là thang đo phải được đánh giá giá trị của nó.

Hai giá trị quan trọng được xem xét trong phần này là giá trị hội tụ và giá trị phân biệt:

Giá trị hội tụ: Các biến quan sát cùng tính chất hội tụ về cùng một nhân tố, khi biểu diễn trong ma trận xoay, các biến này sẽ nằm chung một cột với nhau.

Giá trị phân biệt: Các biến quan sát hội tụ về nhân tố này và phải phân biệt với các biến quan sát hội tụ ở nhân tố khác, khi biểu diễn trong ma trận xoay, từng nhóm biến sẽ tách thành từng cột riêng biệt.

1. Phân tích nhân tố khám phá EFA là gì?

– Phân tích nhân tố khám phá, gọi tắt là EFA, dùng để rút gọn một tập hợp k biến quan sát thành một tập F (với F < k) các nhân tố có ý nghĩa hơn. Trong nghiên cứu, chúng ta thường thu thập được một số lượng biến khá lớn và rất nhiều các biến quan sát trong đó có liên hệ tương quan với nhau. Thay vì đi nghiên cứu 20 đặc điểm nhỏ của một đối tượng, chúng ta có thể chỉ nghiên cứu 4 đặc điểm lớn, trong mỗi đặc điểm lớn này gồm 5 đặc điểm nhỏ có sự tương quan với nhau. Điều này giúp tiết kiệm thời gian và kinh phí nhiều hơn cho người nghiên cứu.

– Với kiểm định độ tin cậy thang đo Cronbach Alpha, chúng ta đang đánh giá mối quan hệ giữa các biến trong cùng một nhóm, cùng một nhân tố, chứ không xem xét mối quan hệ giữa tất cả các biến quan sát ở các nhân tố khác. Trong khi đó, EFA xem xét mối quan hệ giữa các biến ở tất cả các nhóm (các nhân tố) khác nhau nhằm phát hiện ra những biến quan sát tải lên nhiều nhân tố hoặc các biến quan sát bị phân sai nhân tố từ ban đầu.

2. Các tiêu chí trong phân tích EFA

– Hệ số KMO (Kaiser-Meyer-Olkin) là một chỉ số dùng để xem xét sự thích hợp của phân tích nhân tố. Trị số của KMO phải đạt giá trị 0.5 trở lên (0.5 ≤ KMO ≤ 1) là điều kiện đủ để phân tích nhân tố là phù hợp. Nếu trị số này nhỏ hơn 0.5, thì phân tích nhân tố có khả năng không thích hợp với tập dữ liệu nghiên cứu.

– Kiểm định Bartlett (Bartlett’s test of sphericity) dùng để xem xét các biến quan sát trong nhân tố có tương quan với nhau hay không. Chúng ta cần lưu ý, điều kiện cần để áp dụng phân tích nhân tố là các biến quan sát phản ánh những khía cạnh khác nhau của cùng một nhân tố phải có mối tương quan với nhau. Điểm này liên quan đến giá trị hội tụ trong phân tích EFA được nhắc ở trên. Do đó, nếu kiểm định cho thấy không có ý nghĩa thống kê thì không nên áp dụng phân tích nhân tố cho các biến đang xem xét. Kiểm định Bartlett có ý nghĩa thống kê (sig Bartlett’s Test < 0.05), chứng tỏ các biến quan sát có tương quan với nhau trong nhân tố.

– Trị số Eigenvalue là một tiêu chí sử dụng phổ biến để xác định số lượng nhân tố trong phân tích EFA. Với tiêu chí này, chỉ có những nhân tố nào có Eigenvalue ≥ 1 mới được giữ lại trong mô hình phân tích.

– Tổng phương sai trích (Total Variance Explained) ≥ 50% cho thấy mô hình EFA là phù hợp. Coi biến thiên là 100% thì trị số này thể hiện các nhân tố được trích cô đọng được bao nhiêu % và bị thất thoát bao nhiêu % của các biến quan sát.

– Hệ số tải nhân tố (Factor Loading) hay còn gọi là trọng số nhân tố, giá trị này biểu thị mối quan hệ tương quan giữa biến quan sát với nhân tố. Hệ số tải nhân tố càng cao, nghĩa là tương quan giữa biến quan sát đó với nhân tố càng lớn và ngược lại. Theo Hair & ctg (2009,116), Multivariate Data Analysis, 7th Edition thì:

Factor Loading ở mức ± 0.3: Điều kiện tối thiểu để biến quan sát được giữ lại.
Factor Loading ở mức ± 0.5: Biến quan sát có ý nghĩa thống kê tốt.
Factor Loading ở mức ± 0.7: Biến quan sát có ý nghĩa thống kê rất tốt.

Tuy nhiên, giá trị tiêu chuẩn của hệ số tải Factor Loading nên được xem xét cùng kích thước mẫu. Với từng khoảng kích thước mẫu khác nhau, mức trọng số nhân tố để biến quan sát có ý nghĩa thống kê là hoàn toàn khác nhau. Cụ thể, chúng ta sẽ xem bảng dưới đây:

Trên thực tế, việc nhớ từng mức hệ số tải với từng khoảng kích thước mẫu là khá khó khăn, do vậy người ta thường lấy hệ số tải 0.5 làm mức tiêu chuẩn với cỡ mẫu từ 120 đến dưới 350; lấy tiêu chuẩn hệ số tải là 0.3 với cỡ mẫu từ 350 trở lên.

3. Cách phân tích nhân tố khám phá EFA trên SPSS

Lưu ý rằng, cách phân tích nhân tố khám phá trong bài hướng dẫn này áp dụng cho những mô hình đơn giản không có sự xuất hiện của biến trung gian, đề tài không chạy CFA, SEM trên AMOS về sau. Với những đề tài có chạy CFA, SEM trên AMOS, các bạn xem cách thức chạy EFA ở bài viết này.

3.1 Chạy EFA cho biến độc lập

Lần lượt chạy phân tích nhân tố khám phá cho biến độc lập và biến phụ thuộc. Lưu ý, các biến quan sát bị loại ở bước Cronbach Alpha trước đó sẽ không được đưa vào để kiểm định EFA.

Để thực hiện phân tích nhân tố khám phá EFA trong SPSS 20, chúng ta vào Analyze > Dimension Reduction > Factor…

Đưa biến quan sát của các biến độc lập cần thực hiện phân tích EFA vào mục Variables, nếu có biến quan sát nào bị loại ở bước trước đó, chúng ta sẽ không đưa vào phân tích EFA. Chú ý 4 tùy chọn được đánh số ở ảnh bên dưới.

– Descriptives: Tích vào mục KMO and Barlett’s test of sphericity để xuất bảng giá trị KMO và giá trị sig của kiểm định Barlett. Nhấp Continue để quay lại cửa sổ ban đầu.

– Extraction: Ở đây, chúng ta sẽ sử dụng phép trích PCA (Principal Components Analysis). Với SPSS 20 và các phiên bản 21, 22, 23, 24, PCA sẽ được viết gọn lại là Principal Components như hình ảnh bên dưới, đây cũng là tùy chọn mặc định của SPSS. Bên cạnh PCA, chúng ta cũng thường sử dụng PAF, cách dùng hai phép quay phổ biến này, các bạn có thể xem tại bài viết Phép trích Principal Components Analysis (PCA) và Principal Axis Factoring (PAF).

Khi các bạn nhấp chuột vào nút mũi tên hướng xuống sẽ có nhiều tùy chọn phép trích khác nhau. Số lượng nhân tố được trích ra ở ma trận xoay phụ thuộc khá nhiều vào việc lựa chọn phép trích, tuy nhiên, tài liệu này sẽ chỉ tập trung vào phần PCA.

– Rotation: Ở đây có các phép quay, thường chúng ta hay sử dụng Varimax và Promax. Riêng với dạng đề tài đã xác định được biến độc lập và biến phụ thuộc, chúng ta sử dụng phép quay Varimax. Bạn có thể tìm hiểu sự khác nhau cũng như khi nào dùng phép xoay nào tại bài viết Phép quay vuông góc Varimax và phép quay không vuông góc Promax. Nhấp Continue để quay lại cửa sổ ban đầu.

– Options: Tích vào 2 mục như hình bên dưới. Sorted by size giúp sắp xếp ma trận xoay thành từng cột dạng bậc thang để dễ đọc dữ liệu hơn. Suppress small coefficients giúp loại bỏ các hệ số tải không đạt tiêu chuẩn khỏi ma trận xoay, giúp ma trận gọn gàng, trực quan hơn. Tại mục này sẽ có hàng Absolute value below, bạn cần nhập vào giá trị hệ số tải nhân tố Factor Loading tiêu chuẩn. Kích thước mẫu file dữ liệu là 220 nên tác giả sẽ nhập vào 0.5. Nhấp Continue để quay lại cửa sổ ban đầu.

Tại cửa sổ tiếp theo, bạn chọn OK để xuất kết quả ra Output.

Có khá nhiều bảng ở Ouput, tuy nhiên, chúng ta chỉ cần quan tâm 3 bảng:

KMO and Barlett’s Test: xem hệ số KMO và sig kiểm định Bartlett.
Total Variance Explained: xem tổng phương sai trích Total Variance Explained và giá trị Eigenvalue.
Rotated Component Matrix: xem ma trận xoay và kiểm tra hệ số tải Factor Loading của các biến quan sát (Lưu ý tránh nhầm lẫn với bảng Component Matrix)

3.2 Chạy EFA cho biến phụ thuộc

Thực hiện tương tự các bước như cách làm với biến độc lập. Thay vì đưa biến quan sát của các biến độc lập vào mục Variables, chúng ta sẽ đưa các biến quan sát của biến phụ thuộc vào.

Kết quả output, chúng ta cũng sẽ có các bảng KMO and Barlett’s Test, Total Variance Explained, riêng bảng Rotated Component Matrix thường sẽ không xuất hiện mà thay vào đó là dòng thông báo: Only one component was extracted. The solution cannot be rotated.

Điều này xảy ra khi EFA chỉ trích được 1 nhân tố duy nhất từ các biến quan sát đưa vào. Dòng thông báo này tạm dịch là: Chỉ có một nhân tố được trích. Ma trận không thể xoay. Chúng ta luôn kỳ vọng đưa vào 1 biến phụ thuộc thì EFA cũng sẽ chỉ trích ra 1 nhân tố. Việc trích được chỉ 1 nhân tố là điều tốt, nghĩa là thang đo đó đảm bảo được tính đơn hướng, các biến quan sát của biến phụ thuộc hội tụ khá tốt. Lúc này, việc đọc kết quả sẽ dựa vào bảng ma trận chưa xoay Component Matrix thay vì bảng ma trận xoay Rotated Component Matrix.

Không phải lúc nào ma trận xoay có được từ kết quả phân tích EFA cũng tách biệt các nhóm một cách hoàn toàn, việc xuất hiện các biến xấu sẽ làm ma trận xoay bị xáo trộn so với các thang đo lý thuyết. Vậy cách nhận diện biến xấu và quy tắc loại biến xấu trong EFA như thế nào.