Glossary
Học không giám sát là gì
Học không giám sát là một loại học máy xử lý dữ liệu không gán nhãn. Khác với học có giám sát, mục tiêu của nó là tìm ra các mẫu và cấu trúc trong dữ liệu mà không có sự hướng dẫn của nhãn. Kỹ thuật này rất cơ bản trong nhiều ứng dụng, chẳng hạn như phân cụm, giảm chiều và học quy tắc liên kết.
Phân cụm là một phương pháp dùng để nhóm các điểm dữ liệu sao cho các điểm trong cùng một nhóm giống nhau hơn. Giảm chiều giúp đơn giản hóa dữ liệu bằng cách giảm số lượng đặc trưng trong khi vẫn giữ lại thông tin quan trọng. Học quy tắc liên kết giúp phát hiện các mối quan hệ giữa các biến, thường được sử dụng trong phân tích giỏ hàng để hiểu hành vi mua sắm của người tiêu dùng.
Một lợi thế lớn của học không giám sát là khả năng xử lý một lượng lớn dữ liệu không gán nhãn, điều này rất phổ biến trong nhiều tình huống thực tế. Tuy nhiên, nó cũng có những nhược điểm, chẳng hạn như thiếu tiêu chí đánh giá rõ ràng, khiến việc đánh giá hiệu suất của mô hình trở nên khó khăn.
Nhìn về phía trước, có thể dự đoán rằng học không giám sát sẽ ngày càng quan trọng, đặc biệt là trong các lĩnh vực dữ liệu lớn và trí tuệ nhân tạo. Các nhà nghiên cứu đang liên tục khám phá các phương pháp mới để cải thiện hiệu quả của nó, chẳng hạn như sử dụng kỹ thuật học tăng cường và mạng đối kháng sinh điều kiện (GAN).