Quy tắc loại biến xấu trong phân tích nhân tố khám phá EFA

Trước khi đi vào quy tắc loại biến xấu trong EFA. Các bạn cần nắm rõ điều kiện cần để bảng kết quả ma trận xoay có ý nghĩa thống kê là: 

- Hệ số KMO phải nằm trong đoạn từ 0.5 đến 1
- Kiểm định Barlett có sig phải nhỏ hơn 0.05
- Giá trị Eigenvalue lớn hơn hoặc bằng 1
- Tổng phương sai trích lớn hơn hoặc bằng 50%. 

Nếu một trong các tiêu chí trên bị vi phạm, bảng ma trận xoay sẽ không có ý nghĩa. Chính vì vậy, trước khi đến với việc chọn biến nào, loại biến nào các bạn cần kiểm tra xem các tiêu chí ở trên đã thỏa mãn chưa. Mọi thứ OK hết mới đi đến phần loại biến ở ma trận xoay. Nếu bạn chưa rõ về cách chạy EFA và các tiêu chuẩn trong phân tích nhân tố khám phá, bạn nên xem qua bài viết này.

phan-tich-efa-spss

Trước khi đi vào loại biến các bạn cần nắm rõ tiêu chuẩn hệ số tải Factor Loading của bài là bao nhiêu: 0.3 hay 0.5... Phần này khá quan trọng, bởi vì chọn sai giá trị có thể sẽ dẫn đến việc bỏ oan biến, biến có ý nghĩa nhưng chúng ta lại loại khỏi nghiên cứu. Cách chọn hệ số tải các bạn xem bài này.

Để quyết định giữ biến hay loại biến trong phân tích nhân tố khám phá EFA (Exploratory Factor Analysis), dữ liệu cần thỏa mãn 2 điều kiện:

1/ Thỏa mãn "Giá trị hội tụ": Các biến quan sát hội tụ về cùng một nhân tố.

2/ Đảm bảo "Giá trị phân biệt": Các biến quan sát thuộc về nhân tố này và phải phân biệt với nhân tố khác.

Về mặt hiển thị, điều kiện tách biệt là việc các nhóm nhân tố nằm ở khác cột với nhau trong bảng ma trận xoay. 
he-so-tai-nhan-to

Như trong hình ví dụ ở trên. Các biến quan sát từ D1 đến D6 thỏa mãn giá trị hội tụ khi nó cùng giải thích cho nhân tố thứ 1 và trong hiển thị nó sẽ nằm chung trên 1 cột

Giá trị phân biệt ở đây chính là nhóm biến quan sát tải cho nhân tố thứ 1 nó được tách biệt và không tải (hoặc tải rất yếu) cho nhân tố thứ 2, thứ 3...... Nhóm biến quan sát màu đỏ phân biệt so với nhóm biến quan sát màu xanh lá, màu xanh dương.


ma-tran-xoay-nhan-to

Ví dụ ở trên, cỡ mẫu là 220, nên mình chọn hệ số tải tiêu chuẩn là 0.5. Có 2 trường hợp chúng ta sẽ loại 1 biến quan sát:

1. Biến quan sát không đảm bảo hệ số tải tiêu chuẩn

Trong hình ở trên chính là các biến B5, B7, B6. 3 biến này không đảm bảo được hệ số tải lớn hơn hoặc bằng 0.5 nên cần loại bỏ khỏi nghiên cứu. Trường hợp cỡ mẫu từ 350 trở lên (hệ số tải tiêu chuẩn là 0.3), giả sử biến B5 có hệ số tải là 0.4, giá trị này lớn hơn 0.3 nhưng lại nhỏ hơn 0.5. Nếu chúng ta chọn hệ số tải tiêu chuẩn bằng 0.5, nghĩa là chúng ta đã loại bỏ nhầm đi biến B5 mặc dù nó vẫn có ý nghĩa.

Chính vì vậy, mình có lưu ý ở đầu bài viết, việc chọn hệ số tải tiêu chuẩn dựa trên kích thước mẫu là rất quan trọng để tránh việc bỏ đi các biến quan sát có ý nghĩa thống kê.

2. Biến quan sát tải lên ở cả 2 nhân tố và không đảm bảo mức chênh lệch hệ số tải từ 0.3

Nếu 1 biến quan sát tải lên ở cả 2 nhân tố, chúng ta cần xem xét 2 trường hợp nhỏ. Trường hợp 1, biến quan sát tải lên ở cả 2 nhân tố, chúng ta cần lưu ý chênh lệch hệ số tải Factor Loading của biến quan sát giữa 2 nhóm nhân tố. Theo các nhà nghiên cứu, nếu chênh lệch hệ số tải nhỏ hơn 0.3, chúng ta cần loại bỏ biến quan sát đó. Tuy nhiên, chúng ta cũng cần xem xét đóng góp của biến vào giá trị nội dung của nhân tố trước khi quyết định loại bỏ hay giữ lại biến quan sát (Nguồn: Nguyễn Đình Thọ, Phương pháp nghiên cứu khoa học trong kinh doanh, NXB Tài chính, Tái bản lần 2, Trang 420). Trường hợp 2, 2 hệ số tải chênh nhau từ 0.3 trở lên, khi đó biến quan sát sẽ được giữ lại và nó sẽ nằm ở nhóm nhân tố có hệ số tải cao hơn.

Trong kết quả ma trận xoay ở hình ảnh phía trên ,biến A7 tải lên ở cả 2 nhóm với hệ số tải lần lượt là 0.501 và 0.556. 2 giá trị này chênh lệch nhau không tới 0.3, do vậy để đảm bảo "giá trị phân biệt", chúng ta quyết định loại A7 ra khỏi ma trận xoay.

** Mở rộng: Trường hợp có từ 2 biến trở lên cùng tải lên 2 nhân tố

Đối với ma trận xoay có từ 2 biến trở lên đều tải lên nhiều nhân tố chúng ta cần loại lần lượt từng biến xấu nhất để xem sự biến đổi ma trận xoay sau khi từng biến bị loại bỏ. Chúng ta sẽ loại biến có hệ số tải lớn nhất nhỏ nhất trước.


Ví dụ ở hình ảnh phía trên, có 2 biến quan sát là DT3 và LD5 cùng tải lên 2 nhóm. Chúng ta sẽ xem hệ số tải lớn nhất của từng biến quan sát:
  • Biến DT3 có hệ số tải lớn nhất là: 0.663
  • Biến LD5 có hệ số tải lớn nhất là 0.652
Như vậy hệ số tải lớn nhất của biến DT3 > hệ số tải lớn nhất của biến LD5, ta sẽ loại biến LD5 trước và chạy lại phân tích nhân tố EFA.

Trên đây, mình đã trình bày về cách thực hiện loại biến trong phân tích EFA, Cám ơn các bạn đã quan tâm, nhớ LIKE + SHARE bài viết cho bạn bè đang gặp khúc mắc về vấn đề này nhé.

--------
Nếu bạn gặp khó khăn khi thực hiện phân tích EFA vì số liệu khảo sát xấu dẫn đến bảng ma trận xoay lung tung, biến bị loại rất nhiều, bạn có thể tham khảo dịch vụ phân tích SPSS của mình ở đây hoặc liên hệ trực tiếp email phamlocblog@gmail.com. Dịch vụ mình cung cấp giúp bạn nâng hệ số KMO, đảm bảo ma trận xoay hội tụ như mong muốn, không bị loại quá nhiều biến, khắc phục lỗi không xuất hiện bảng KMO, bị tách nhân tố, biến nhảy lung tung.