文件格式:word
文件大小:603.00KB
适用专业:Apriori关联规则
适用年级:大学
下载次数:13 次
我要下载:点击联系下载论文编号:12093
资料简介:
课程设计 关联规则挖掘算法的改进(共33页,17124字)
摘要
数据挖掘是近十多年来发展起来针对大规模数据处理的一项新技术,关联规则作为其中一种重要的局部处理模型,占有极其重要的地位,它反映了数据库中数据项目间的关联关系。本文我们通过对关联规则相关概念进行分析和讨论,提出基于经典Apriori关联规则挖掘算法的改进。
目前在各种改进挖掘算法研究中,单独采用Hash树结构或最大熵模型的改进算法已经出现。但在本文中我们尝试将这两种处理方法联合一起,组成一个改进算法模块,通过加入Apriori算法流程,以提高算法的效率。最后我们采用模拟分析将本改进算法与其他方法进行了比较,结果显示能够明显改进Apriori算法效率。
关键词:关联规则;Apriori算法;Hash树;最大熵
目 录
第1章 前 言 1
1.1 数据挖掘研究背景和目的 1
1.2 数据挖掘的研究现状 1
1.3 未来展望 3
第2章 数据挖掘中的关联规则 4
2.1数据挖掘的相关概念 4
2.1.1数据挖掘的概念 4
2.1.2关联的概念 5
2.1.3关联规则的概念 5
2.2 问题的提出 6
2.3 研究思路 7
第3章 关联规则挖掘算法 9
3.1 关联规则形式化定义 9
3.1.1问题描述 9
3.1.2 关联规则种类 10
3.1.3 数据库中的关联规则模型 10
3.2 Apriori算法 12
3.2.1 算法步骤描述 13
3.2.2 Apriori算法的缺点 15
第4章 改进算法 17
4.1 算法改进思路的参考模型 17
4.2 Hash树存储结构 18
4.2.1 Hash树定义 18
4.2.2 Hash树存储结构适用性讨论 20
4.3 最大熵模型 22
4.3.1 最大熵模型描述 22
4.3.2 最大熵模型适用性讨论 22
4.4 算法改进 23
第5章 分析评价 27
结 论 28
致 谢 29
参考文献 30
资料文件预览:
共1文件夹,1个文件,文件总大小:603.00KB,压缩后大小:203.07KB
- 课程设计-关联规则挖掘算法的改进
关联规则挖掘算法的改进.doc [603.00KB]
我要下载:关联规则挖掘算法的改进