基于关联规则的高校人力资源数据仓库构建与信息挖掘.pdfVIP

基于关联规则的高校人力资源数据仓库构建与信息挖掘.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
江西通信科技 1009—0940(2011)04·0031—05 谭国强 肖力江西省信息中心南昌330046 摘要:本文针对一个真实的高校人力资源数据集,通过进行特征值的离散化 和特征值的归约、特征选择和构造等方面的探索性数据分析,构建了在高校人力资 源管理中适用的数据仓库。并给出了基于关联规则的高校人事信息再挖掘方法,研 究分析的结果具有较好的解释_生,对高校的^力资源管理具有一定的管理学意义。 关键词:高校人力资源管理关联规则特征归约数据挖掘 0.引曹 。数据仓库首先可以被看作一个特殊的DBMS,我们 处于现代信息社会.高校人力资源管理的核心字 所开发的平台包含如图1所示: 眼将是“信息”二字。目前,高校^事部门利用管理 信息系统已经积累了大量的数据,但对现有数据资源 缺乏有效的组织、整理和提取,进行客观分析难度很 大,在其中寻找决策支持时更显得不知所措。基于高 校人力资源管理工作量大,工作内容繁琐而义重要等 因素.迫切需要实现信息管理的科学性、系统性。数 据仓库技术的出现及投展,大大简化了数据的整台与 转换,它能对繁杂的数据进行有效地组织,通过公正 客观的统计和分析,快速而正确地找出隐含的模式, 准确地掌握未来动态,提高数据利用的效率和能力。 ’i , 删洲 ” 随着竞争的日益激烈.高校要想获得跨越式发展,必 0卷i器。l 须充分利用先进的信息技术,高校人事部门建立高校 图1高校人力资源数据仓库结构图 人力资源数据仓库,用数据挖掘辅助决策分析将成为 高校人力资源数据仓库建立的过程实际上是从 发展趋势。 传统的以数据库为中心的操作型系统结构转移到以数 1.设计高校人力资溽救器仓库 据仓库为中心的体系结构的过程。要实现体系结构的 数据仓库是一个面向对象的、结台的、非易失性 变迁,要做的第一件事就是了解系统己经具备了哪些 的、时间可变的、用于管理决策支持的数据集合【1] 数据,这是建立数据仓库的基点。了解系统具有的数 收稿日期:2011。11。17 L二=:互■~二曼堡竺!… 据之后,可以根据用户需求分析确定数据挖掘系统主 明确。如“教育水平”中的分类不够准确清晰而被删 题。对于一个大型的数据仓库系统,涉及的业务系统 除。原“学位”特征既描述员工学习专业,又描述员 众多、功能复杂,因此采用螺旋式开发方法,通过将 工获得的最高学位,将其表述明确为最高学位。 庞大的目标分成若干个实施阶段,分而治之[2]。关联 数据集的数据整理方法如下: 规则挖掘子系统是其中比较简单明确的小问题之一。 (1)将日期型特征变量转化为数值型。如用 2.高校人力资源数据仓库数据的预处理与转换 “年龄”, “校龄”, “工龄”特征分别表示原来 论文采用的入力资源数据集取自江西南昌一所理 的“出生日期”、“聘用日期”、“工作日期”等 工科大学,是一个真实的数据集(数据集隐去了工号、 特征变量。 姓名等个人隐私信息)。 (2)将数值型特征变量离散化。离散化的准则是 数据集记录了员工的个人统计信息、学位、专 离散化后的每一个特征离散化取值所包含的员工数接 业、技术职称、本校工作经历等信息。数据集中反映 近,同时离散化过程对离散化的划分点不敏感[3]。根 员工基本个人信息的数据库特征有数百个之多,分布 据这个准则,对数值型特征取值的分布绘图,在数据 在数10个数据库表中。根据专家建议,选取了有代表 分类汇总的图形按谷底分类,将数据离散化。如“年 意义的特征24个,包括:所属音13t3、国籍、民族、出生龄”变量可以离散

文档评论(0)

spmf14 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档