- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于邮件挖掘社会网络核心层的新方法.doc
基于邮件挖掘社会网络核心层的新方法
第31卷第3期
2010年6月
大连交通
JOURNALOFDAUAN
大学
JI.AOTONGUNIVERSITY
V01.31N0.3
Jun.2010
文章编号:1673—9590(2010)03-0092-05
基于邮件挖掘社会网络核心层的新方法
田宏,马朝阳
(大连交通大学软件学院,辽宁大连116028)
摘要:社会网络分析应用于挖掘各组织及组织内部成员之间通信行为,是一种新的研究方法,在分析基
于邮件构成的网络基础上,提出一种挖掘社会网络核心层的新方法MCCY.该方法首先删除结点度小于一
定阈值的结点,再运用社团结构及中心度分析找出部分网络核心成员,最后结合已删除的结点得出完整的
网络核心层.实验结果显示,该方法可以找出全部的网络核心成员,且在一定程度上解决了大型网络不容
易计算的问题.
关键词:社会网络;社团结构;结点度;核心成员;核心层
中图分类号:TP311.11文献标识码iA
0引言
互联网给人们带来了很多方便和好处,通过
浏览和有哪些信誉好的足球投注网站可以访问到很多需要的信息,但这也
意味着在电脑保护系统中打开了一些通道.电
子邮件不仅仅成为了人们工作中的必需工具,也
是人与人之间通信的重要方法.连通的迅速,使用
的便利,成本的低廉使电子邮件成为了继语音通
信后第二大流行的通信手段….通信过程中潜伏
着巨大的安全隐患,对于某些专门的安全部门,邮
件截获效率与处理效率不成比例,在海量邮件数
据中漫无目的的搜寻目标为安全工作带来了极大
的困难.针对已截获可疑邮箱中存在的海量电子
邮件,研究了如何对海量邮件数据进行分析处理,
如何有效准确的挖掘出面向安全部门的敏感社
团,并在此基础上挖掘网络核心成员.
1相关工作
作为社会网络分析的新的分支,犯罪网络
(CrimeNetwork)的研究受到各国政府和相关机
构的特别关注,已经研究了通过分析相关事件消
息,将犯罪组织社会网络可视化的技术].文献
[3]从相关报道中挖掘出911恐怖袭击事件的19
个参与者的社会网络.文献[4]开发出了一种基
于层次贝叶斯推理构建恐怖组织网络结构的工具
NETEST,可预测犯罪网络规模,确定成员关系.
目前,国内在利用社会网络对犯罪组织的研
究工作多集中于社团结构(社会网络子集)挖掘
和核心人物查找方面,挖掘素材主要针对电子邮
件,BBS和聊天室等.如:文献[5]在聊天室数据
时序性的基础上利用启发式规则推断出聊天室用
户的网络关系;文献[6]结合时序性和内容相似
性挖掘聊天室的社会网络关系;文献[7]在电子
邮件数据中对时间属性,内容信息和地址数据进
行逐层分析和筛选过滤之后挖掘原始邮件数据背
后隐含的社团结构;文献[8]用中介度来挖掘邮
件网络中的社团结构;文献[9]设计了一种基于
个性特征的仿真邮件分析系统MEP,提出一种利
用个性特征判别矩阵计算个性特征矢量各个维度
权重的新方法,借助符合用户个性特征的正态分
布模型模拟真实的邮件通信行为,为了挖掘犯罪
网络的核心,提出了一种基于社会网络分析挖掘
犯罪组织核心的算法.
收稿日期:2009.10—19
基金项目:辽宁省教育厅高等学校科学研究计划资助项目(2008093)
作者简介:田宏(1968一),女,副教授,博士,主要从事人工智能,数据挖掘等工作的研究
E?mail:mcy8214@126.com.
第3期田宏,等:基于部件挖掘社会网络核心层的新方法93
2社会网络的建立及挖掘核心层分析
2.1对于设置阈值构建的社会网络分析
首先说明一些相关概念:
定义1结点度的概念J.结点的度定义
为与此结点具有连接关系的结点的数量.
定义2社团结构的概念J.如果网络图中
的子集满足以下条件,便可以称该子集具有社团结
构:每个子集各自的顶点之间有许多连线,而该子集
与其它子集之间几乎没有连线.寻找一个网络图中
的社会关系是识别相关结点群组的一种有效方法.
定义3图的中心势¨.用中心势刻画网络
图的整体中心性,以达到比较不同图的中心趋势
的目的.
在邮件头,邮件体的解析和提取工作已经完
成,并将按特定格式取出的邮件信息存储到数据
库对应的表中之后就可以构建社会网络了.文献
[8]的做法是:根据电子邮件地址数据直接构造
出一个网络图,图中顶点代表联系人,顶点之间的
连线表示某两个联系人具有相互关系.通过设定
阈值,选取收(发)件数量(即结点的度)大于阈值
的邮件地址,以符合条件的邮件地址为基本地址
集合,构造出网络联系图.阈值的设置可以排除掉
认为是偶然事件产生的噪声数据,阈值的改变会
影响网络图的构成情况.按照设定的阈值构造出
初始网络图,将邮件信息进行了初步,粗略的筛
选,并通过邻接矩阵对网络图进行描述和存储.
设置阈值虽然消除了一定的噪声,但也可能
删除了一些对整个网络来
您可能关注的文档
- 教师听课记录范文-水土保持资料.doc
- 大学英语考试至级精华句(CET to , elite ).doc
- 基于b fs架构的猪病中兽医诊治专家系统的设计.docx
- 北语秋《离散数学》作业答案解析.doc
- 中国仓储服务质量评鉴申报表 - 山东省物流与采购协会.doc
- 郑州轻工业学院电子信息工程专业(模板).doc
- 金税三期工程纳税服务架构需求..doc
- 概率论与数理统计浙江大学第四版课后习题答案[].doc
- 外国人:中国将成全球劳动力受教育程度最高国家之一.doc
- 2008年报检员资格全国统一考试模拟试卷(In 2008, the qualification of national testing staff was unified).doc
文档评论(0)