- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
反垃圾邮件系统设计
班级:通信工程0301班
姓名:李靖
指导教师:刘树君
反垃圾邮件系统设计
摘要
电子邮件是人们使用较多的一种通信方式,然而在给人们带来大量快捷的同时,其副产品垃圾邮件也给人们的生活增添了无穷的烦恼。如今我们接收到了大量的垃圾邮件,这对收件人的时间、带宽和存储资源产生了无效占用,网络链路因此造成拥塞,它还被作为不良信息的载体被到处散发。因此本文主要讨论了一些常用的反垃圾邮件技术,主要包括关键字匹配技术,实时黑名单技术,反向查询技术,详细介绍了贝叶斯技术的基本原理及其代码实现,最后对应用实验的不足进行了总结并提出了进一步的研究方向。
关键词:反垃圾邮件,关键字匹配,实时黑名单,贝叶斯算法
Design of anti-spam systerm
Abstract
E-mail is one manner of communication between us that we use frequently,for its convenience and rapidness,but spam whose byproduct bring endless bother to our life. Now,the amount of the spam we received has exceeded that of needed mail,the time,bandwidth and memory resource of addressees’ is tied up ineffectively,thereby,network connection generate congestion.The text discusses some commen anti-spam technology,such as keyword-matching,real-time black list, reverse query,and elaborate on basic theory and code realization of Bayesian technology,at last the thesis summarize the lack of the experiment and bring forward the direction of father research.
Keywords: anti-spam , e-mail filtering, RBL ,Bayesian categorization
目录
1.绪论 6
1.1研究背景 6
1.2垃圾邮件的定义 7
1.3研究现状及相应法规 8
1.3.1国内外反垃圾邮件技术研究现状 8
1.3.2反垃圾邮件法律与政策 9
1.4论文的主要内容和章节安排 10
1.4.1论文的主要内容 10
1.4.2论文的章节安排 11
2反垃圾邮件的基本原理 12
2.1电子邮件简介 12
2.1.1邮件的格式 12
2.1.2邮件的传送 13
2.2 POP3与SMTP简介 14
2.2.1SMTP协议 14
2.2.2POP3协议 17
2.3反垃圾邮件的系统架构 18
3反垃圾邮件技术 20
3.1 过滤 20
3.1.1 关键词过滤 20
3.1.2 黑白名单 21
3.1.3 HASH技术 21
3.1.4 基于规则的过滤 21
3.1.5 智能和概率系统 22
3.1.6 过滤技术的局限性和缺点 22
3.2 验证查询 23
3.2.1 反向查询技术 23
3.2.2 局限性和缺点 24
4反垃圾邮件系统的实现 25
4.1中文分词理论 25
4.1.1 基于字符串匹配的分词方法 25
4.1.2基于理解的分词方法 27
4.1.3基于统计的分词方法 27
4.2关键字匹配与实时黑名单技术 28
4.3贝叶斯算法及其代码实现 30
4.3.1贝叶斯算法基本原理 30
4.3.2贝叶斯算法举例及代码实现 34
4.3.3对于贝叶斯技术的一些建议 41
5总结与展望 43
5.1总结 43
5.2展望 44
致谢 46
参考文献 47
1.绪论
1.1研究背景
随着Internet的广泛普及,越来越多的人走进了Internet。互联网极大的方便着现代社会中的人们,而电子邮件作为网络中的一部分,起到了很好的拉近人与人之间距离的作用,它已经成为网络交流沟通的重要途径。然而也随之带来了其副产品——垃圾邮件,它给每一位网络用户,网络管理员和ISP带来了无尽的烦恼。据统计,全世界因为垃圾邮件每年要损失1000万美元,近来的调查也显示,93%的被调查者都对他们接受到的大量垃圾邮件非常不满。由于垃圾邮件的泛滥,使得原本畅通的互联网速度变的逐渐缓慢,并且浪费了用户大量的时间。企业员
文档评论(0)