Chúng ta đã qua bài thứ hai về phân tích dữ liệu trong Quản lý chất lượng Nhật Bản. Trong bài viết này Blogsanxuat sẽ giới thiệu một số khái niệm liên quan đến dữ liệu và thống kê.
Khái niệm đầu tiên chúng ta tìm hiểu sẽ tập dữ liệu mẹ và mẫu.
Tập dữ liệu mẹ và mẫu trong phân tích dữ liệu
Đầu tiên chúng ta sẽ xem xét ví dụ sau.
Có một công xưởng sản xuất hàng điện tử đặt hàng 100 chiếc công tắc. Khi hàng được chuyển đến họ lấy ra 10 chiếc bất kỳ để kiểm tra. Nội dung kiểm tra bao gồm: ngoại quan và tính năng bên trong.
Tại trường hợp này điều mà công xưởng này muốn biết chính là chất lượng của 100 chiếc công tắc (mục đích). Chứ không phải chất lượng của 10 chiếc công tắc kia.
100 chiếc công tắc này chúng ta sẽ định nghĩa là Tập dữ liệu mẹ. Còn 10 chiếc công tắc lấy ngẫu nhiên kia gọi là Mẫu. Còn ngoại quan và tính năng chính là một đặc tính chất lượng.
Trong quản lý chất lượng, có nhiều trường hợp số lượng cần kiểm tra quá lớn mà chúng ta không đủ thời gian xem hết. Do đó để đánh giá được chất lượng của toàn số lượng sản phẩm này (tập dữ liệu mẹ) thì chúng ta kẽ chỉ kiểm tra một số lượng mẫu nhất định. Từ những đặc tính của mẫu chúng ta sẽ đánh giá đặc tính của toàn bộ số sản phẩm.
Cách phân loại tập dữ liệu mẹ
Tập dữ liệu mẹ sử dụng trong phân tích dữ liệu sẽ được chia thành hai loại chính:
- Tập dữ liệu mẹ hữu hạn: Là những nhóm dữ liệu bị giới hạn. Ví dụ: “Những sản phẩm nhập trong ngày hôm nay”, hay “Những sản phẩm lắp ráp hôm qua”.
- Tập dữ liệu mẹ vô hạn: là những nhóm dữ liệu không có giới hạn về độ lớn. Ví dụ: “Số sản phẩm được sản xuất tại công xưởng A”.
Nếu nhìn từ cách định nghĩa trên thì hầu hết chi tiết sản xuất trong công xưởng đều là tập dữ liệu mẹ vô hạn. Do đó, để quản lý chất lượng của chi tiết, chúng ta sẽ chia nhỏ ra để quản lý.
Đơn vị thường được các công xưởng sử dụng chính là lô hàng (lot)
Lô hàng (lot) được định nghĩa là một tập hợp những sản phẩm cùng được sản xuất trong cùng một điều kiện giống nhau.
Thông thường, những chi tiết được sản xuất trong một ca, hoặc 1 ngày sẽ được tính là cùng lô.
Vì thế, đối tượng chính mà chúng ta quản lý hàng ngày chính là những lô hàng của từng sản phẩm.
Trong bài tiếp theo chúng ta sẽ cùng tìm hiểu về cách lấy mẫu và sai số.