Khai thác luật thiết yếu nhất từ tập phổ biến đóng
Lê Hoài Bắc, Võ Đình Bảy
Tóm tắt
Theo cách khai thác luật kết hợp truyền thống, việc tìm tất cả các luật kết hợp từ CSDL thỏa minSup và minConf gặp nhiều bất lợi khi số tập phổ biến lớn. Do đó cần có một phương pháp thích hợp để khai thác với số luật ít hơn nhưng vẫn bảo đảm tích hợp đầy đủ tất cả các luật của phương pháp khai thác truyền thống. Bài báo đề xuất thuật toán sinh luật thiết yếu nhất từ tập phổ biến đóng: chỉ lưu lại các luật có tiền kiện nhỏ nhất và hậu kiện lớn nhất theo quan hệ tập con. Thực nghiệm chứng tỏ tập luật kết quả khá nhỏ so với tập luật truyền thống, thời gian khai thác luật cũng nhanh hơn so với truyền thống bởi vì khai thác luật thiết yếu nhất dựa vào tập phổ biến đóng (FCI – Frequent Closed Itemsets) trong khi khai thác luật truyền thống dựa vào tập phổ biến (FI – Frequent Itemsets) mà |FCI| |FI|.