基于SVM的中文电子邮件作者性别识别技术研究-计算机应用技术专业论文.docxVIP

基于SVM的中文电子邮件作者性别识别技术研究-计算机应用技术专业论文.docx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于SVM的中文电子邮件作者性别识别技术研究-计算机应用技术专业论文

摘要 随着科技的飞速发展,网络成为人们交换、获取信息的新平台,其中电子邮件以 其快捷、经济的特点,改变了传统的通信方式,成为人们重要的通信手段。电子邮件 给人们带来便利的同时,也给人们提出了许多新问题,如垃圾邮件、病毒邮件、诈骗 邮件、反动邮件等非法邮件泛滥的问题。这些非法邮件给社会造成的危害越来越大, 如何有效遏制非法邮件的传播,惩治非法邮件的制作者已成为社会关注的热点。但要 找到邮件的原始制作者,并向法庭提供有效证据,使之得到应有惩罚并不容易。因为 邮件制作者可利用网络和电子邮件的特点,隐匿真实身份,通过匿名服务器发送邮件 或伪造地址、更改姓名。因此,由邮件头部信息确定邮件作者的真实身份的工作很难 实现。所以需要研究一种邮件作者身份的识别方法,确定邮件作者的真实身份,并为 计算机取证提供依据,从而达到控制非法邮件传播的目的。如何确定邮件作者的真实 身份呢?人的身份是由其个性身份特征组成的,如年龄、性别、职业、教育程度等等, 所以确定邮件作者的真实身份,就要确定其个性身份特征,这样才能有效锁定邮件作 者,并达到取证的目的。 目前,对邮件作者身份的识别研究已有开展,并取得初步研究成果,但对作者的 个性身份特征的识别还鲜有涉及。因性别是确定人身份的重要特征,且识别判定作者 的性别后,可有效缩小识别范围,进一步提高邮件作者身份识别效率,为计算机取证 提供技术支持,所以,本文选择识别中文电子邮件作者的性别这一研究热点,在国内 外的相关研究基础上进行了研究和探索。 本文首先对与本研究相关的电子邮件身份识别、作者性别识别等研究领域的国内 外现状进行了论述,探讨了现有研究技术和方法。并从理论和技术的角度探讨了中文 电子邮件作者性别识别的基本问题和任务模型。在详细分析中文邮件正文中性别语言 差异的基础上,提出了可用于识别中文电子邮件作者性别的特征模式;在借鉴已有研 究成果的基础上,对特征提取方法以及权值确定方法的进行了探讨;分析研究了利用 支持向量机算法识别邮件作者性别的方法。为了验证所提出的模式和方法的正确性与 可行性,本研究对有限数据集进行了实验研究。分别采用不同的特征、不同的特征组 合以及综合特征等方法进行了实验。实验结果表明本研究提出的方法是可行的,但识 别效果还远达不到计算机取证的要求,需进一步提高。 关键词:电子邮件;性别语言;身份识别;支持向量机;计算机取证 Study on the Author’s Gender Identification for Chinese E.mail Documents Based OHSVM Author:Yang Jing Supervisor:Professor Teng Guifa Professor Wu Fengxiang Major:Computer Applied Technology Abstract With the rapid growth of science and technology,people use the network exchange information.E-mail has become an expedient and economical form of communication.at same time,unfortunately,the phenomenon of e-mail misusage is common on the InterneL such as virus andjunk mail、even fraud mail etc.And the damage is increasing.This needs to detect the true author of e-mail and take measure.In these mails,the sender always attempts to hide his true identity in order to avoid detection.The sender’S address can be fo玛ed and routed through anonymous mail server,or the sender’S name may have been modified.So it is difficult to find out the real identity ofe—mail and undoubtedly to identify the original author of illegitimate e-mail.It is necessary to study a method to identify the original authors di

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档