+高级检索
基于格的快速频繁项集挖掘算法
DOI:
作者:
作者单位:

作者简介:

通讯作者:

基金项目:


Lattice-based Algorithm for Fast Mining Frequent Itemsets
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
    摘要:

    随着数据库规模的增加或支持度阈值的减少,频繁模式的数量将以指数形式增长,FP-growth算法运行的时空效率将大为降低.本文提出一种基于格的快速频繁项集挖掘算法LFP-growth,算法利用等价关系将原来的搜索空间(格)划分成若干个较小的子空间(子格),通过子格间的迭代分解,将对网格P(I)的频繁项集挖掘转化为对多个子格的并集进行的约束频繁项集挖掘.实验结果和理论分析表明,在挖掘大型数据库时,LFP-growth算法的时间和空间性能均优于FP-growth算法.

    Abstract:

    Along with the increasing size of database and the reduction of support threshold, the number of frequent patterns will grow exponentially, and the time and space efficiency of the FP-growth algorithm will greatly reduce. The cause of low efficiency was analyzed, and according to the analysis, a lattice-based algorithm for fast mining frequent itemsets (LFP-growth) was presented. The proposed algorithm divided a large lattice into many sub-lattices by using equivalence relation. Through iterativing decomposition of sublattices, frequent itemset mining in lattice was transformed into frequent itemsets mining in a union set of multiple sublattices. Experiments have shown that the time and space performance of LFP-growth algorithm is superior to that of FP-growth algorithm in mining large database.

    参考文献
    相似文献
    引证文献
文章指标
  • PDF下载次数:
  • HTML阅读次数:
  • 摘要点击次数:
  • 引用次数:
引用本文

刘彩苹,毛建频,毛建旭,屈卫兰,蔡玉武.基于格的快速频繁项集挖掘算法[J].湖南大学学报:自然科学版,2013,40(10):52~57

复制
历史
  • 收稿日期:
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期:
  • 出版日期:
作者稿件一经被我刊录用,如无特别声明,即视作同意授予我刊论文整体的全部复制传播的权利,包括但不限于复制权、发行权、信息网络传播权、广播权、表演权、翻译权、汇编权、改编权等著作使用权转让给我刊,我刊有权根据工作需要,允许合作的数据库、新媒体平台及其他数字平台进行数字传播和国际传播等。特此声明。
关闭