Tạp chí Phát triển Khoa học và Công nghệ, T. 11, S. 1 (2008)

Cỡ chữ:  Nhỏ  Vừa  Lớn

Khai thác luật thiết yếu nhất từ tập phổ biến đóng

Lê Hoài Bắc, Võ Đình Bảy

Tóm tắt


Theo cách khai thác luật kết hợp truyền thống, việc tìm tất cả các luật kết hợp từ CSDL thỏa minSup và minConf gặp nhiều bất lợi khi số tập phổ biến lớn. Do đó cần có một phương pháp thích hợp để khai thác với số luật ít hơn nhưng vẫn bảo đảm tích hợp đầy đủ tất cả các luật của phương pháp khai thác truyền thống. Bài báo đề xuất thuật toán sinh luật thiết yếu nhất từ tập phổ biến đóng: chỉ lưu lại các luật có tiền kiện nhỏ nhất và hậu kiện lớn nhất theo quan hệ tập con. Thực nghiệm chứng tỏ tập luật kết quả khá nhỏ so với tập luật truyền thống, thời gian khai thác luật cũng nhanh hơn so với truyền thống bởi vì khai thác luật thiết yếu nhất dựa vào tập phổ biến đóng (FCI – Frequent Closed Itemsets) trong khi khai thác luật truyền thống dựa vào tập phổ biến (FI – Frequent Itemsets) mà |FCI|  |FI|.

Toàn văn: PDF

Tạp chí Phát triển Khoa học và Công nghệ/Journal of Science and Technology Development
ISSN: 1859-0128

VietnamJOL is supported by INASP