文件格式:word
文件大小:840.00KB
适用专业:计算机
适用年级:大学
下载次数:3 次
我要下载:点击联系下载论文编号:7042
资料简介:
毕业设计 基于贝叶斯的反垃圾邮件技术探讨,共31页,19618字。
本文首先分析了垃圾邮件的产生、现状、主要特征和危害,概要性地探讨了现有的几种主要反垃圾邮件技术,其中包括关键词过滤技术、验证过滤技术、规则过滤技术和内容过滤技术。
接着,详细论证了基于内容的朴素贝叶斯过滤技术,它是目前众多反垃圾邮件技术中最为行之有效、应用最为广泛的技术。在分析了朴素贝叶斯反垃圾邮件技术的原理和算法后,对其优缺点进行了评价,发现该算法忽略了把合法邮件错判为垃圾邮件带来的损失。
然后,针对上面所提到的缺陷,提出了一种改进方法,即基于最小期望损失的贝叶斯过滤算法。在该算法中引入了期望损失因子,并在文中分析了期望损失因子与精确率的关系,得出期望损失因子的变化规律,从最小期望损失的角度改善了朴素贝叶斯算法。在此算法的理论推导基础上,用实际的邮件样本对改进后的算法进行了验证。验证结果表明,选取合适的期望损失因子值,最小期望损失的贝叶斯过滤算法能有效提高邮件过滤的精确率。
关键词:反垃圾邮件 贝叶斯 过滤算法 期望损失因子 最小期望损失
目 录
1 导论 1
1.1选题意义 1
1.2文献综述 1
1.3写作思路 2
2 概述 3
2.1垃圾邮件的产生和现状 3
2.1.1产生 3
2.1.2现状 3
2.2垃圾邮件的定义 4
2.3垃圾邮件的主要特征及危害 5
2.4人们对垃圾邮件的态度 5
3 目前反垃圾邮件的主要技术 6
3.1简单的垃圾邮件过滤技术 6
3.1.1关键词过滤技术 6
3.1.2验证过滤技术 6
3.1.3规则过滤技术 7
3.1.4内容过滤技术 7
3.2朴素贝叶斯过滤技术简介 7
4 基于朴素贝叶斯过滤算法的反垃圾邮件技术 8
4.1贝叶斯定理简介 8
4.2朴素贝叶斯过滤算法 9
4.2.1 贝叶斯分类器 9
4.2.2贝叶斯邮件过滤器 11
4.2.3朴素贝叶斯过滤算法的原理 11
4.2.4朴素贝叶斯过滤算法的基本步骤 12
4.2.5朴素贝叶斯过滤算法实例 14
4.2.6朴素贝叶斯过滤算法的优缺点 15
5 最小期望损失的贝叶斯过滤算法 15
5.1改进的贝叶斯分类器 16
5.2最小期望损失过滤系统的设计 16
5.2.1邮件预处理 17
5.2.2特征项的提取 17
5.2.3训练算法 18
5.2.4最小期望损失算法 19
5.2.5最小期望损失算法实例 22
5.3最小期望损失算法的验证 22
5.4最小期望损失算法的优势分析 24
6 进一步的研究方向 25
6.1 贝叶斯反垃圾邮件技术的局限性 25
6.2 展望 25
参考文献 26
致谢 27
资料文件预览:
共1文件夹,1个文件,文件总大小:840.00KB,压缩后大小:170.79KB
- 毕业设计-基于贝叶斯的反垃圾邮件技术探讨
267993$edu315$基于贝叶斯的反垃圾邮件技术探讨毕业论文.doc [840.00KB]
我要下载:基于贝叶斯的反垃圾邮件技术探讨