文件格式:word
文件大小:6.64MB
适用专业:计算机网络
适用年级:大学
下载次数:12 次
我要下载:点击联系下载论文编号:201761
资料简介:
毕业设计-一个基于网格和密度的聚类算法的实现,正文共24页,13762字。
【摘要】
权威的Gartner调查组报告显示,数据挖掘将是今后几年全球范围内重点投资研究的十大新技术之一,它引起了学术界和工业界的广泛关注,是当今数据库系统研究和应用领域内的一个热点问题。本文讨论数据挖掘中聚类的相关概念、技术和算法。在已提出的聚类算法中,一大类都是基于“距离”的概念,不管是传统的欧氏几何距离还是其它意义上的距离,如常见的k-means、k-medoids算法,这类算法的缺点在于处理大数据集和高维数据集时不够有效,另一方面它能发现的聚类个数常常依赖于用户参数的指定,而这对用户来说经常是很困难的。这里要讨论的算法与此有根本的不同,既它抛弃了距离的概念,而采取一种新的思路,我们称之为基于网格和密度的算法,它的优点在于能够自动发现包含有趣知识的子空间,并将里面存在的所有聚类挖掘出来;另一方面它能很好的处理高维数据和大数据集的数据表格。算法将最后的结果用DNF的形式表示出来。
【关键词】
数据挖掘、聚类规则/分析、网格、密度、高维数据、字空间、最大区域、DNF表达式
1 索引 2
2 摘要 3
3 关键词 3
4 正文 4
4.1 数据挖掘 4
4.2 聚类分析 8
4.3 算法实现及其应用背景 10
4.3.1 背景 10
4.3.2 问题描述 12
4.3.3 算法实现 15
4.3.3.1.1 找出包含聚类的子空间 15
4.3.3.1.2 找出给定子空间中的聚类 17
4.3.3.1.3 生成对聚类的一个描述 19
4.3.4 算法运行的一个实例 20
5 结束语 22
6 参考文献 23
7 致谢 23
资料文件预览:
共1文件夹,1个文件,文件总大小:6.64MB,压缩后大小:528.61KB
- 毕业设计-一个基于网格和密度的聚类算法的实现
- 基于网格和密度的聚类算法的实现.doc [6.64MB]
我要下载:一个基于网格和密度的聚类算法的实现