Tương quan là gì, lưu ý khi dùng và các ví dụ trực quan

J
jamysonbohrer5832
Bình luận: 0Lượt xem: 694
J

jamysonbohrer5832

Thành viên
  • J

    jamysonbohrer5832

Trong thống kê, tương quan là thước đo mối quan hệ tuyến tính giữa hai biến. Hệ số tương quan thường được dùng nhất là hệ số tương quan Pearson với ký hiệu R. Chúng ta cùng tìm hiểu về tương quan cũng như cùng xem các ví dụ trực quan dễ hiểu.
1. Tương quan là gì?
Tương quan là hệ số để đo lường sự kết hợp tuyến tính giữa hai biến khác nhau. Hệ số tương quan luôn nhận giá trị từ -1 đến 1 trong đó:

  • -1 cho thấy mối tương quan tuyến tính nghịch hoàn toàn giữa hai biến
  • 0 cho thấy không có mối tương quan tuyến tính giữa hai biến
  • 1 cho thấy mối tương quan tuyến tính thuận hoàn toàn giữa hai biến

Tương quan là gì?

Chúng ta thường sử dụng hệ số tương quan khi muốn định lượng mối quan hệ tuyến tính giữa hai biến, trong đó cả hai biến đều không đại diện cho mối quan hệ nhân quả, chỉ là có quan hệ tuyến tính với nhau thôi.

Sau khi hiểu được tương quan là gì, chúng ta cùng xem tiếp các ví dụ trực quan.
2. Các ví dụ thực tế
Các ví dụ đơn giản sau đây sẽ giúp các bạn hình dung khi nào bạn nên và không nên sử dụng mối tương quan trong thực tế.

Ví dụ 1: Nên sử dụng hệ số tương quan

Giả sử một giáo sư muốn hiểu mối quan hệ tuyến tính giữa điểm thi toán và điểm thi tổng hợp các môn khoa học cho các học sinh trong lớp của mình. Liệu các học sinh đạt điểm cao trong bài thi toán cũng đạt điểm cao trong bài thi khoa học? Hay những học sinh đạt điểm cao trong môn toán có xu hướng đạt điểm thấp trong môn khoa học?

Trong trường hợp này, vị giáo sư có thể tính toán mối tương quan giữa điểm thi toán và điểm thi khoa học vì ông chỉ đơn giản muốn hiểu mối quan hệ tuyến tính giữa hai biến. Giả sử giáo sư tính toán hệ số tương quan Pearson và thấy nó là r = 0,78. Hệ số tương quan 0,78 là một mối tương quan thuận chặt chẽ, có nghĩa là học sinh đạt điểm cao về môn toán cũng có xu hướng đạt điểm cao về môn khoa học.

Ví dụ 2: Khi nào không sử dụng tương quan

Giả sử một bộ phận marketing tại một số công ty muốn định lượng chi tiêu quảng cáo ảnh hưởng đến tổng doanh thu như thế nào. Công ty muốn biết đối với mỗi đồng được chi cho quảng cáo, công ty có thể kiếm được bao nhiêu doanh thu tăng thêm?

Trong trường hợp này, bộ phận marketing nên sử dụng mô hình hồi quy tuyến tính để lượng hóa mối quan hệ giữa chi tiêu quảng cáo và tổng doanh thu vì biến "doanh thu" là một biến phụ thuộc. Bạn cần tìm ra mỗi đồng tiền được chi thêm cho quảng cáo dẫn đến mức tăng trung bình là bao nhiêu đồng trong tổng doanh thu, còn dùng tương quan chỉ biết được mức độ tương quan nghịch hay thuận giữa hai biến đó mạnh yếu như thế nào thôi.
3. Lưu ý khi sử dụng tương quan
Điều quan trọng cần lưu ý là mối tương quan chỉ có thể được sử dụng để định lượng mối quan hệ tuyến tính giữa hai biến, chỉ ra được mức độ tương quan thuận / nghịch lớn đến mức nào.

Trong một số trường hợp, hệ số tương quan sẽ không thể nắm bắt một cách hiệu quả mối quan hệ giữa hai biến có mối quan hệ phi tuyến tính. Ví dụ như chúng ta có 2 biến có mối quan hệ như sau:

Biểu đồ mối quan hệ giữa hai biến phi tuyến tính

Nếu chúng ta tính toán hệ số tương quan giữa hai biến này, nó sẽ ra r = 0. Điều này có nghĩa là không có mối quan hệ tuyến tính giữa hai biến. Tuy nhiên từ biểu đồ, chúng ta có thể thấy rằng hai biến thực sự có mối quan hệ lẫn nhau. Nói chung ngay cả khi hai biến không có mối quan hệ tuyến tính, thì có thể chúng vẫn có mối quan hệ phi tuyến tính sẽ được hiển thị trong biểu đồ phân tán.
4. Kết
Hệ số tương quan được sử dụng nhiều trong thống kê, tuy nhiên các bạn cần lưu ý phân biệt được tương quan không giống như mối liên hệ nhân quả. Ngoài ra, nếu các bạn muốn tìm đọc thêm nhiều bài viết về các hệ số quan trọng khác, hãy truy cập https://toptradingforex.com/.
 
Bên trên