Blog Single

Biểu đồ phân tán: Biểu thị mối quan hệ giữa hai yếu tố chất lượng

Biểu đồ phân tán là một thủ pháp dùng để biểu diễn mối quan hệ giữa hai loại dữ liệu khác nhau x và y. Trước khi đi vào tìm hiểu biểu đồ phân tán, chúng ta sẽ cùng tìm hiểu về mối quan hệ tương quan giữa hai loại dữ liệu

1. Quan hệ tương quan

Trong hai loại dữ liệu mà chúng ta thu thập để phân tích mối tương quan sẽ bao gồm hai dạng là yếu tốđặc tính.

  • Yếu tố chúng ta những dữ liệu được cho là nguyên nhân dẫn đến một kết quả nào hay hiện tượng.
  • Đặc tính là những dữ liệu dạng kết quả.

Chúng ta có thể hiểu đơn giản rằng yếu tố chính là nguyên nhân dẫn tới đặc tính (kết quả). Ví dụ, khi suy nghĩ về hai yếu tố tốc độ gia công và độ bóng bề mặt mặt gia công, thì tốc độ gia công chính là yếu tố (nguyên nhân) và độ bóng bề mặt gia công chính là đặc tính (kết quả). Bởi khi tốc độ gia công càng lớn thì độ bóng bề mặt sẽ giảm và ngược lại. Và mối quan hệ giữa hai dữ liệu này chính là mối quan hệ tương quan. Và tính tương quan sẽ được biểu diễn bằng hệ số tương quan.

Chúng ta sẽ phân tích một ví dụ đơn giản sau đây để hiểu thêm về mối quan hệ tương quan và biểu diễn mối quan hệ này bằng biểu đồ phân tán.

Dưới đây là bảng dữ liệu của 10 người đang giảm cân cùng với thời gian họ đọc sách và vận động.

Thành viên Thời gian đọc sách Lượng ăn (kcal) Thời gian vận động (phút) Hiệu quả giảm cân (g)
1 71 1900 65 120
2 45 2300 25 95
3 55 2200 27 90
4 67 2600 17 86
5 69 2500 17 90
6 55 2000 27 106
7 56 1600 57 125
8 62 2300 52 112
9 53 2500 38 104
10 72 1900 11 97

Và lần lượt biểu đồ phân tán thể hiện sự nỗ lực của mỗi thành viên và hiệu quả giảm cân của họ.

Biểu đồ mối quan hệ tương quan giữa thời gian đọc sách và hiệu quả giảm cân
Biểu đồ mối quan hệ tương quan giữa thời gian vận động và hiệu quả giảm cân
Biểu đồ mối quan hệ tương quan giữa lượng ăn và hiệu quả giảm cân

Từ ba biểu đồ trên chúng ta có thể thấy đọc sách không có tác dụng giảm cân, vận động có tác dụng giảm cân và lượng ăn có tác dụng ngược tới hiệu quả giảm cân. Làm sao để biết được điều này, mình sẽ chia sẻ tiếp về cách đọc biểu đồ phân tán.

2. Cách đọc quan hệ tương quan của dữ liệu trên biểu đồ phân bố

Vậy làm sao để biết hai dữ liệu có quan hệ với nhau như thế nào? Thực ra câu trả lời đã có sẵn trên biểu đồ phân tán. Mối quan hệ giữa hai dữ liệu chủ yếu nằm ở 5 dạng chính:

  • Có mối tương quan dương: Khi x tăng thì y cũng tăng thì x và y được gọi có mối quan hệ tương quan dương. Trong trường hợp x là nguyên nhân (yếu tố) và y là kết quả (đặc tính) thì chỉ cần quản lý được x chúng ta sẽ quản lý được y. Theo như ví dụ trên thì chỉ cần vận động nhiều chúng ta sẽ đoán được hiệu quả giảm cân sẽ được nâng cao.
Mối tương quan dương giữa vận động và hiệu quả giảm cân
Mối tương quan dương giữa vận động và hiệu quả giảm cân
  • Có một chút tương quan dương: Đây là trường hợp x tăng thì y cũng có xu hướng tăng nhưng không rõ rệt. Có thể, ngoài x ra thì còn yếu tố khác có ảnh hưởng để làm tăng y. Và chúng ta cần tìm thêm yếu tố này nếu muốn quản lý y.
  • Không có tương quan: Dù x có tăng chúng ta cũng không nhìn thấy y tăng. Điển hình ở đây là trường hợp dù có đọc sách bao nhiêu cũng không giúp các thành viên giảm béo. Rất tiếc, nhưng việc trở thành mọt sách sẽ không giúp bạn giảm cân.
Không có tương quan giữa thời gian đọc sách và hiệu quả giảm cân
Không có tương quan giữa thời gian đọc sách và hiệu quả giảm cân
  • Có một chút tương quan âm: Khi x tăng thì y có khuynh hướng giảm tuy nhiên không rõ rệt. Tương tự, y giảm có thể do ảnh hưởng của một yếu tố khác nữa và chúng ta cần tìm ra yếu tố này.
  • Có tương quan âm: Khi x tăng thì y giảm. Trong trường hợp x là nguyên nhân (yếu tố) và y là kết quả (đặc tính) thì chỉ cần quản lý được x chúng ta sẽ quản lý được y. Theo như ví dụ trên thì càng ăn nhiều chúng ta sẽ đoán được hiệu quả giảm cân sẽ càng giảm.
Tương quan âm giữa lượng ăn và hiệu quả giảm cân
Tương quan âm giữa lượng ăn và hiệu quả giảm cân

Biểu đồ phấn tán cũng là một công cụ hữu ích để tìm mối tương quan giữa các yếu tố khi tìm kiếm nguyên nhân để giải quyết một vấn đề nào đó. Ví dụ bạn có thể áp dụng để tìm kiếm nguyên nhân sản phẩm đúc bị lỗi có liên quan đến nhiệt độ đúc hay thời gian nóng chảy vật liệu hay không.

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *