基于邮件挖掘社会网络核心层的新方法.docVIP

基于邮件挖掘社会网络核心层的新方法.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于邮件挖掘社会网络核心层的新方法.doc

基于邮件挖掘社会网络核心层的新方法 第31卷第3期 2010年6月 大连交通 JOURNALOFDAUAN 大学 JI.AOTONGUNIVERSITY V01.31N0.3 Jun.2010 文章编号:1673—9590(2010)03-0092-05 基于邮件挖掘社会网络核心层的新方法 田宏,马朝阳 (大连交通大学软件学院,辽宁大连116028) 摘要:社会网络分析应用于挖掘各组织及组织内部成员之间通信行为,是一种新的研究方法,在分析基 于邮件构成的网络基础上,提出一种挖掘社会网络核心层的新方法MCCY.该方法首先删除结点度小于一 定阈值的结点,再运用社团结构及中心度分析找出部分网络核心成员,最后结合已删除的结点得出完整的 网络核心层.实验结果显示,该方法可以找出全部的网络核心成员,且在一定程度上解决了大型网络不容 易计算的问题. 关键词:社会网络;社团结构;结点度;核心成员;核心层 中图分类号:TP311.11文献标识码iA 0引言 互联网给人们带来了很多方便和好处,通过 浏览和有哪些信誉好的足球投注网站可以访问到很多需要的信息,但这也 意味着在电脑保护系统中打开了一些通道.电 子邮件不仅仅成为了人们工作中的必需工具,也 是人与人之间通信的重要方法.连通的迅速,使用 的便利,成本的低廉使电子邮件成为了继语音通 信后第二大流行的通信手段….通信过程中潜伏 着巨大的安全隐患,对于某些专门的安全部门,邮 件截获效率与处理效率不成比例,在海量邮件数 据中漫无目的的搜寻目标为安全工作带来了极大 的困难.针对已截获可疑邮箱中存在的海量电子 邮件,研究了如何对海量邮件数据进行分析处理, 如何有效准确的挖掘出面向安全部门的敏感社 团,并在此基础上挖掘网络核心成员. 1相关工作 作为社会网络分析的新的分支,犯罪网络 (CrimeNetwork)的研究受到各国政府和相关机 构的特别关注,已经研究了通过分析相关事件消 息,将犯罪组织社会网络可视化的技术].文献 [3]从相关报道中挖掘出911恐怖袭击事件的19 个参与者的社会网络.文献[4]开发出了一种基 于层次贝叶斯推理构建恐怖组织网络结构的工具 NETEST,可预测犯罪网络规模,确定成员关系. 目前,国内在利用社会网络对犯罪组织的研 究工作多集中于社团结构(社会网络子集)挖掘 和核心人物查找方面,挖掘素材主要针对电子邮 件,BBS和聊天室等.如:文献[5]在聊天室数据 时序性的基础上利用启发式规则推断出聊天室用 户的网络关系;文献[6]结合时序性和内容相似 性挖掘聊天室的社会网络关系;文献[7]在电子 邮件数据中对时间属性,内容信息和地址数据进 行逐层分析和筛选过滤之后挖掘原始邮件数据背 后隐含的社团结构;文献[8]用中介度来挖掘邮 件网络中的社团结构;文献[9]设计了一种基于 个性特征的仿真邮件分析系统MEP,提出一种利 用个性特征判别矩阵计算个性特征矢量各个维度 权重的新方法,借助符合用户个性特征的正态分 布模型模拟真实的邮件通信行为,为了挖掘犯罪 网络的核心,提出了一种基于社会网络分析挖掘 犯罪组织核心的算法. 收稿日期:2009.10—19 基金项目:辽宁省教育厅高等学校科学研究计划资助项目(2008093) 作者简介:田宏(1968一),女,副教授,博士,主要从事人工智能,数据挖掘等工作的研究 E?mail:mcy8214@126.com. 第3期田宏,等:基于部件挖掘社会网络核心层的新方法93 2社会网络的建立及挖掘核心层分析 2.1对于设置阈值构建的社会网络分析 首先说明一些相关概念: 定义1结点度的概念J.结点的度定义 为与此结点具有连接关系的结点的数量. 定义2社团结构的概念J.如果网络图中 的子集满足以下条件,便可以称该子集具有社团结 构:每个子集各自的顶点之间有许多连线,而该子集 与其它子集之间几乎没有连线.寻找一个网络图中 的社会关系是识别相关结点群组的一种有效方法. 定义3图的中心势¨.用中心势刻画网络 图的整体中心性,以达到比较不同图的中心趋势 的目的. 在邮件头,邮件体的解析和提取工作已经完 成,并将按特定格式取出的邮件信息存储到数据 库对应的表中之后就可以构建社会网络了.文献 [8]的做法是:根据电子邮件地址数据直接构造 出一个网络图,图中顶点代表联系人,顶点之间的 连线表示某两个联系人具有相互关系.通过设定 阈值,选取收(发)件数量(即结点的度)大于阈值 的邮件地址,以符合条件的邮件地址为基本地址 集合,构造出网络联系图.阈值的设置可以排除掉 认为是偶然事件产生的噪声数据,阈值的改变会 影响网络图的构成情况.按照设定的阈值构造出 初始网络图,将邮件信息进行了初步,粗略的筛 选,并通过邻接矩阵对网络图进行描述和存储. 设置阈值虽然消除了一定的噪声,但也可能 删除了一些对整个网络来

文档评论(0)

zhangningclb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档