基于FP-tree的关联规则算法的研究与应用任务书

 2021-08-19 11:08

1. 毕业设计(论文)主要目标:

本文主要开展并完成以下目标: (1) 全面了解挖掘关联规则相关算法,了解关联规则挖掘算法的应用。 (2) 重点研究基于FP-tree的关联规则挖掘算法一FP-growth算法,掌握该算法的基本原理,并分析该算法存在的相关问题。 (3)拟针对传统的FP-tree算法进行改进,使之占用更小的存储空间。 (4)对相关算法进行实现,并在数据集上进行相关实验,验证算法及改进方法的有效性。(5)按照学校要求完成相关毕业论文撰写工作。

2. 毕业设计(论文)主要内容:

关联规则挖掘是数据挖掘的基本问题之一。经典的关联规则挖掘算法主要是基于频繁集的方法,相关的算法主要有Apriori算法和FP-growth算法。FP-growth算法采用不同于以前Apriori系列算法的候选产生测试方法,采取模式增长的方法挖掘关联规则,它克服了Apriori系列算法的缺陷,取得了很好的效果。但是,FP-growth算法仍然存在着一些不足,如算法的性能严重依赖于数据库的大小,挖掘关联规则时需要递归地生成和释放成千上万的条件模式树等等。本文拟针对FP-growth算法进行较为深入的研究,探讨其中存在的问题,开展相关研究与改进,进行相关实验验证,形成相关论文。

3. 主要参考文献

[1].《数据挖掘概念与技术》Jiawei Han著,范明等译,机械工业出版社.[2].刘喜苹,刘彩苹,谭义红.《一个新的不需要候选集的挖掘关联规则算法---Relim算法研究》.计算技术与自动化. [3].陈凯,冯全源.《最大频繁项目集的高效挖掘》.微电子学与计算机. [4].丛丹,王俊普,杨文等.《基于FP-Tree的模式分解算法》.计算机工程. [5].谈克林,孙志辉.《一种FP树的并行挖掘算法》.计算机工程与应用 .[6].(英)David Hand, Heikki Mannila, Padhraic Smyth著,张银奎,廖丽,宋俊等译.《数据挖掘原理》.北京:机械工业出版社,2003.4. [7]. Srikant R} Agrawal R. Mining Generalized Association Rules. Proceedings of the 1995 Very Large Databases Conference.[8]. Park. J S, Chen M S, Yu P S.An Ei}ective hash based Algorithm for Mining Association Rules.In Proceedings 1995 ACM SIGMOD International conference Management of Data (SIGMOD95). San Jose, CA: 1995,175-186.[9].Park. J S, Chen. M S, Yu P S. An Efective hash based Algorithm for Mining Association Rules. IEEE Traps. On Knowledge and Data Engineering. 1997,9(5):813-825.[10].Toivonen H. Sampling Large Databases for Association Rules .In Proceeding 1996 InternationalconferenceVeryLargeDataBases件LDB96).India:Bombay, 1996,134-145.

剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。