(数据挖掘/机器学习)频繁项集:在事务型数据(如购物篮数据)中,出现频率达到或超过给定最小支持度(min-support)阈值的一组“项(items)”。常用于发现关联规则与共现模式。(也常写作 frequent item set)
/ˈfriːkwənt ˈaɪtəmˌsɛt/
A frequent itemset is a group of items that often appear together in transactions.
频繁项集是一组在交易记录中经常一起出现的商品(或项目)。
Using Apriori, we first find all frequent itemsets and then generate association rules with high confidence.
使用 Apriori 算法时,我们先找出所有频繁项集,再生成高置信度的关联规则。
frequent 来自拉丁语 frequens,意为“经常发生的、频繁的”。itemset 是现代复合词,由 item(“条目/项目”,源自拉丁语 item,有“同样地、此外”之意,后演变为“条目”)与 set(“集合”,源自古英语 set 的相关形式)组合而成,整体表示“项目的集合”。在数据挖掘语境中,frequent itemset 专指“达到支持度阈值的项集合”。