Phân tích tương quan Pearson trong SPSS

Phân tích tương quan Pearson là một trong các bước chúng ta thực hiện trong bài nghiên cứu sử dụng phân tích định lượng SPSS. Thường bước này sẽ được thực hiện trước khi phân tích hồi quy.

phan-tich-tuong-quan-pearson-spss


Mục đích chạy tương quan Pearson nhằm kiểm tra mối tương quan tuyến tính chặt chẽ giữa biến phụ thuộc với các biến độc lập, vì điều kiện để hồi quy là trước nhất phải tương quan.

Ngoài ra cần nhận diện vấn đề đa cộng tuyến khi các biến độc lập cũng có tương quan mạnh với nhau. Dấu hiệu nghi ngờ dựa vào giá trị sig tương quan giữa các biến độc lập nhỏ hơn 0.05 và giá trị tương quan Pearson lớn hơn 0.4. Khi gặp phải nghi ngờ này, các bạn cần chú ý đến đa cộng tuyến sẽ được xem xét khi phân tích hồi quy (kiểm tra hệ số VIF), xem cách nhận xét VIF ở bài viết Cách phân tích và đọc kết quả hồi quy trong SPSS.

CÁCH CHẠY TƯƠNG QUAN PEARSON


Các bạn truy cập vào thẻ Analyze > Correlate > Bivariate…

phan-tich-tuong-quan-pearson-spss (1)


Hộp thoại Bivariate Correlations xuất hiện, các bạn đưa các biến độc lập và biến phụ thuộc từ cột bên trái sang bên phải. Để thuận tiện cho quá trình đọc số liệu, các bạn nên sắp sếp biến phụ thuộc nằm trên cùng (trong hình là biến SA). Sau đó các bạn chọn OK.

phan-tich-tuong-quan-pearson-spss (2)


Bảng tương quan Correlations xuất hiện trong Output của các bạn. Tiến hành đọc số liệu:


Trong hình minh họa ở trên, các biến tô màu xanh lá là biến độc lập, biến tô màu vàng là biến phụ thuộc. Giá trị sig tô màu cam là sig giữa các biến độc lập với biến phụ thuộc, và sig tô màu hồng là đại diện cho sig giữa các biến độc lập với nhau. Tạm gọi hệ số tương quan Pearson (Pearson Correlation) là r:

Yếu tố cần quan tâm đầu tiên là giá trị sig. Giá trị sig nhỏ hơn 0.05 thì hệ số tương quan r mới có ý nghĩa thống kê, giá trị sig lớn hơn 0.05 nghĩa là r có lớn nhỏ thế nào cũng không liên quan gì cả, bởi vì nó không có ý nghĩa, hay nói cách khác không có tương quan giữa 2 biến này

> VỚI GIÁ TRỊ SIG TÔ MÀU CAM:           


Giá trị sig tô màu cam nào nhỏ hơn 0.05 nghĩa là biến độc lập đó có tương quan với biến phụ thuộc, giá trị sig tô màu cam nào lớn hơn 0.05 nghĩa là biến độc lập đó KHÔNG tương quan với biến phụ thuộc và nên loại bỏ biến đó trước khi đi vào chạy hồi quy. Khi sig nhỏ hơn 0.05, các bạn chú ý tới hệ số tương quan Pearson r để đánh giá mức độ tương quan mạnh/yếu giữa các biến độc lập với biến phụ thuộc.

> VỚI GIÁ TRỊ SIG TÔ MÀU HỒNG:           


Giá trị sig tô màu hồng của các biến độc lập với nhau thì nó CÀNG LỚN CÀNG TỐT. Nếu các giá trị sig này lớn hơn 0.05 nghĩa là giữa các biến độc lập này không có mối tương quan và nó càng khẳng định tính "độc lập" tốt giữa các biến độc lập. Nếu sig nhỏ hơn 0.05 thì các bạn sẽ bắt đầu lưu ý tới hệ số tương quan Pearson để xem tính tương quan mạnh hay yếu giữa các biến và đặt ra nghi ngờ có thể xảy ra đa cộng tuyến giữa các biến độc lập. 
Cần lưu ý, ở bước Pearson chúng ta chỉ đặt nghi vấn chứ không có bất kỳ một tính toán, so sánh chính xác nào để chứng minh rằng giữa 2 biến độc lập có đa cộng tuyến xảy ra. Nghi vấn này sẽ được trả lời dựa vào hệ số VIF khi phân tích hồi quy, mời các bạn xem tại bài viết Cách phân tích và đọc kết quả hồi quy trong SPSS.


> HỆ SỐ TƯƠNG QUAN PEARSON:


Hệ số tương quan Pearson càng tiến về 1 càng tương quan mạnh. Ngược lại, hệ số này càng tiến gần về 0 thì tương quan càng yếu.

Các bạn cần lưu ý đến giá trị sig: nếu bạn chọn mức ý nghĩa 1% thì giá trị sig phải < 0.01, còn nếu bạn chọn mức ý nghĩa là 5% thì sig < 0.05 tương ứng với các dấu (*) được đánh dấu trên hệ số tương quan r. Chú thích ở 2 hàng cuối cùng trong bảng Correlation

**. Correlation is significant at the 0.01 level (2-tailed)
*. Correlation is significant at the 0.05 level (2-tailed)