- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
定稿:孤立点数据挖掘技术在审计信息化中应用
孤立点数据挖掘技术在审计信息化中的应用研究 Application of auditing Informationization with the Outlier Data Ming Technology 周喜 曾丽 (湖南商学院,会计学院,湖南 长沙 410205) 摘要:孤立点分析技术是数据挖掘的重要内容之一,可广泛应用到电信、信用卡欺骗检测、贷款审批、客户分类、气象预报和网络入侵检测等领域。在审计工作中,也可采用孤立点检测算法对审计数据进行判断和检测是否存在异常,帮助审计人员及时发现隐藏的审计线索,提高审计效率,孤立点数据挖掘技术比发现规律性的其他挖掘技术具有更好的现实应用价值。 关键词:审计信息化;孤立点分析;数据挖掘 一、引言: 随着信息技术的不断发展及企业数据库管理信息系统的数据海量增加,传统以查账为主审计方法将遇到计算机技术的挑战,让审计人员不得不重新调整作业方法,选择计算机审计方式检查被审计单位的经济活动,发挥现代审计监督的作用[1]。目前,虽然有许多通用软件公司开发了相关的审计人员,也加快了我国审计信息化的步伐,但也由于这些软件的功能较局限,让企业审计信息化的内容基本是传统审计方法及流程计算机化而已。如审计人员依据统计方法、法律规则以及审计经验建立查询分析模型,然后对被审计单位的业务上可能违规的现象做一个假设,再通过电子数据来检验假设,这都要求审计人员有非常丰富的工作经验,而违规假设方法也大大增加了审计人员的工作量。这种方法先进的信息技术含量较少,也严重影响了我国审计信息化的发展深度,如何充分利用先进信息化技术,如孤立点分析技术去发现海量数据中隐藏或未知的信息,让“智能”的数据处理方法帮助审计人员迅速发现异常交易或事项,快速确定审计事项及重点,提高审计效率,降低审计成本及风险,是未来审计信息化研究的重点和难点[2]。目前,国内研究审计软件、审计信息化和数据挖掘在审计中的应用的学者并不多,其中,著名的学者有南京审计学院陈伟副教授对审计软件现状及发展趋势、基于数据匹配技术的审计证据获取方法和信息系统审计新的安全服务模式都进行了较深的研究;吕新民教授对信息化环境下审计项目管理及数据挖掘在审计数据分析中的应用方面都出了研究水平较高的学术论文;陈丹萍教授和杭州电子科技大学辛金国等人对基于数据挖掘技术的联网审计进行了较深入的研究;华南理工大学的张炳才等人对基于欧式距离孤立点挖掘方法在审计中的应用进行了相关的研究等。 二、数据挖掘技术 数据挖掘是从大量的、不完全的、随机的、模糊的和在噪声的实际应用数据中发现趋势、规则和模式的过程,他融合了现代统计、决策理论、数据库管理和机器学习等多学科的知识,这门广义的交叉学科徽剧了不同领域的研究者,如数据库、并行计算、数理统计、可视化和人工智能等方面的学者和工程技术人员。数据挖掘技术一般分为聚类分析、分类分析、关联分析、序列分析、时间序列分析、依赖关系分析、偏差分析和孤立点分析等。数据挖掘基本过程分为:问题定义、数据收集、数据预处理、数据挖掘和结果解释及评估。数据挖掘主要算法及方法包括神经网络(Neural Networks)、序列模式分析(Sequential Pattern)、决策树(Decision Tree)、遗传算法(Gentic Algorithous)、模糊算法(Fuzzy Algorithous)、聚类分析(Cluster Analysis)、粗糙集规则(Rough Set Rule)、关联分析(Assoliantion Analysis)等[3]。 三、孤立点分析定义及方法 孤立点分析(Outlier Detection)是指数据集中可能包含一些不符合数据一般模型与行为的对象,如部分极端值等。孤立点分析也是数据挖掘中一个重要的研究方向。如在金融行业里,可利用基于孤立点分析的欺诈模型对每个信用卡客户近期及历史用卡行为进行分析,如检测到不寻常的信用卡使用情况,就拟确定为交易有欺诈行为,及时与持卡人联系确认交易是否存在欺诈,银行是否予以授权、是否冻结对方资金等操作。 孤立点分析方法包括基于统计(分布)的孤立点检测、基于距离的孤立点检测、基于密度的孤立点检测、基于聚类的孤立点检测、基于偏离的孤立点检测、基于深度孤立点检测等六种方法。 3.1 基于统计(分布)的孤立点检测方法 统计方法是先假设在给定的数据集合有一个分布或概率模型,然后采用不一致性检验来定义和发现孤立点。基于统计(分布)的方法虽然易于理解,实现起来也较为方便,但只对数据分布满足某种概率分布的数值型单变量(属性)数据才有效,不适合用于多维空间的孤立点检测。因此,基于统计(分布)的孤立点检测方法应用范围受到大大的限制。 3.2 基于距离的孤立点检测方法 为了有效的避免基于统计(分布)方法中的数据分布适应性的限制,拓
您可能关注的文档
- 园林绿化工程设计图纸会审情况记1.doc
- 国家税制复习提纲.doc
- 国赫红珊湾.doc
- 国贸实务 第二章.ppt
- 国际动漫节即将开幕.doc
- 国际私法(第五讲).ppt
- 图形创意2010-2011-1授课计划.doc
- 国风竹韵-植物PPT模板.ppt
- 图片上传的设计与实现.doc
- 图纸会审记录附页.doc
- 2025年无人机低空医疗物资投放社会效益报告.docx
- 2025年再生塑料行业包装回收利用产业链重构研究.docx
- 《AI眼镜周边产品市场机遇:2025年终端销售与需求增长洞察》.docx
- 2025年坚果加工行业深加工技术突破与市场拓展策略报告.docx
- 2025年通信芯片行业技术竞争与未来趋势报告.docx
- 《2025年生鲜电商配送冷链事故分析与预防措施》.docx
- 《商业航天融资新趋势2025民营卫星企业资本涌入估值分析市场动态》.docx
- 2025年能源绿色健康行业创新技术与市场应用报告.docx
- 2025年无人机低空医疗救援通信方案分析报告.docx
- 2025年烹饪机器人行业市场集中度分析报告.docx
有哪些信誉好的足球投注网站
文档评论(0)