- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术在社会保险信息分析中应用浅析
数据挖掘技术在社会保险信息分析中应用浅析
内容摘要:数据挖掘是一项多学科综合的技术,它旨在发现海量数据中隐藏的、未知的、潜在的有用模式或知识。随着社会的进步,社会保险信息分析涉及对大量业务数据进行有效的管理和利用,将数据挖掘的理论和技术应用于社会保险信息分析中具有研究价值和应用效果。本文首先介绍了社会保险及社会保险信息分析的相关概念,同时介绍了数据挖掘技术的基本理论,并详细论述了该技术在社会保险信息分析中的具体实施过程,最后展望了数据挖掘技术在社会保险信息分析中的未来发展趋势。
关键词:数据挖掘;社会保险;信息分析
据挖掘是人们对数据库技术进行研究和开发的结果,目前已在诸多领域得到了广泛应用,只要该领域拥有具备分析价值和相关需求的数据,就可以利用挖掘工具进行数据挖掘。但现今国内把数据挖掘技术应用于社会保险信息分析领域的研究较少,在各种书籍专著中,目前相关专著仅有由劳动和社会保障部培训就业司、中国就业培训技术指导中心组织编写的,由中国劳动社会保障出版社于2008年3月出版的《社会保障信息分析与数据挖掘》。目前社会保障管理现状所面临的诸多问题中,其中就有对大量已有数据的无视和浪费,而数据挖掘技术可以帮助有关人员从社会保险的大量数据中发现事实背后的规律,通过对参保人员的特征数据分析,应用分类、聚类、关联规则和决策树等数据挖掘方法,界定不同参保人员的信用等级,从而针对不同的参保人员提供相应的服务,为构建和谐社会做出必要贡献。
一、社会保险信息分析概述
社会保险 (Social Insurance) 是由法律规定的专门机构负责实施、面向劳动者建立、通过向劳动者及其雇主筹措资金建立专项基金,以保证在劳动者失去劳动收入后获得一定程度的收入补偿的制度。
我国的社会保险包括养老保险(含城镇职工基本养老保险、企业年金、个人储蓄性养老保险、农村养老保险等)、医疗保险(含城镇职工基本医疗保险、城镇居民医疗保险和新农村合作医疗保险)、失业保险、工伤保险、生育保险五种。主管单位为中华人民共和国人力资源和社会保障部。
社会保险分析就是通过已掌握的社会保险相关信息资料,运用相关分析方法加以分析,反映社会保险的现象并揭示其内在的规律性,为社会保险政策制定、科学决策和规范管理提供咨询意见和对策建议。
通过对社会保险信息进行分析,一方面可以真实客观地反映出社会保险政策的执行情况,确保社会保险目标的实现,并不断总结社会保险事业发展过程中的经验与教训;另一方面,又可为决策层提供反馈信息,为科学决策做好必要准备。
二、数据挖掘技术概述
(一)数据挖掘概念。数据挖掘,又称为数据库中的知识发现,就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识。
并不是所有的信息发现任务都被视为数据挖掘。有些任务虽然重要且涉及使用复杂的算法和数据结构,但是它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息,所以并不是我们这里所谈到的数据挖掘。
(二)数据挖掘方法
常用的数据挖掘方法有:
1.决策树方法:用树形结构来表示决策集合,这些决策集合通过对数据集的分类产生规则。
2.遗传算法:它是在生物进化的概念基础上设计的一???优化技术,它包括基因组合、交叉、变异和自然选择等一系列过程,通过这些过程以达到优化的目的。
3.人工神经网络:它从结构上模仿生物神经网络,是一种通过训练来学习的非线性预测模型,可以完成分类、聚类、特征挖掘等多种数据挖掘任务。
4.最近临技术:这种技术通过已辨别历史记录的组合来辨别新的记录,它可以用来作聚类和偏差分析。
5.规则归纳:通过统计方法来归纳、提取有价值的规则。规则归纳技术在数据挖掘中被广泛应用。典型的方法有集合论的粗集方法和概念树方法等。另外,还有可视化方法、公式发现方法等。
三、数据挖掘技术在社会保险信息分析中的应用
社会保险是一项关系国计民生的事业。随着我国社会保险事业的不断发展,对多年来积累的大量历史数据进行有效分析,从而为决策工作提供正确的指导、为管理实施找到详实的依据,成为目前社会保险行业最迫切的需求。
(一)社会保险信息分析的程序
第一步:明确分析目的,拟定分析提纲,编制分析计划。
第二步:搜集、鉴别、整理资料。
第三步:编制分析表。
第四步:进行系统的分析研究。
第五步:撰写分析报告。
(二)数据挖掘流程
1.数据清理:消除噪声与不一致的数据。
2.数据集成:多种数据源可以整合到一起。
3.数据选择:从数据库中检索和分析出任务相关数据。
文档评论(0)