- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分布式数据环境下关联规则挖掘算法研究-计算机应用技术专业论文
II II 要 近些年来,人们收集数据、存储数据的能力得到了空前的提高,我们可以轻 而易举地获得海量数据,在这些海量数据背后隐藏着许多重要的信息,理解它们 已经远远超出了人的能力,这就需要一种强有力的数据库分析工具。数据库知识 发现(KDD)就是为顺应这种需要而发展起来的一门学科,它用来进行数据分析,发 现重要的数据模式,并且已经成为一个重要而活跃的研究领域。 数据挖掘被视为数据库知识发现过程的一个基本步骤,它已引起了信息产业 界的极大关注,其主要原因是“数据丰富,但信息贫乏”,为了有效利用这些海 量数据,如何将它们转换为有用的信息和知识就成为当务之急。随着计算机和网 络技术的发展,我们可以方便地获取 Internet 上的各种信息资源,传统的集中式数 据挖掘已经不能满足需要。企业的数据资源往往规模大、动态增长并且存在于地 理上分布的各个数据库中,把所有数据集中在一起进行处理既不可取,也不可行, 这使得数据挖掘系统必须具有分布式挖掘的能力。基于分布式信息资源的数据挖 掘日益受到人们的关注,成为信息科学研究领域中一个新的课题。 关联规则挖掘是近些年来研究较多、应用也最为广泛的数据挖掘方法。关联 规则挖掘于 1993 年由 Agrawal 等人提出,它最初是以分析事务数据库中项与项之 间的联系为目标,后来的研究者们对问题原型进行了多方面的改进和扩充。关联 规则挖掘问题的关键是频繁项集的产生,Apriori 算法是一种经典的挖掘布尔关联 规则的算法,本文将用它在局部站点来产生频繁项集。 分布式数据环境下的关联规则挖掘算法中,时间开销主要体现在两方面:(1) 频繁项集的确定;(2) 网络的通讯量。本文提出了一种基于 Web Services 框架的 改进算法 DARM(Distributed Association Rules Mining),成功地克服了 FDM 算法 中可能造成频繁项集丢失的缺点,保证了数据挖掘结果的完整性和正确性,同时 也减少了站点间的通讯量。 关键词:分布式数据环境;数据挖掘;关联规则;知识发现;Web Services PAGE PAGE IV Abstract In the last decade, we have seen an explosive growth in our capabilities to both of collecting and storing data, and generate massive data by further computer processing. Interpretation and understand for massive data are beyond our ability. As a result, a powerful analysis tool is needed to be developed. Consequently, the discipline of knowledge discovery in databases(KDD), which used for analyzing data and discovering important data model, has evolved into an important and active research area. Data mining is a step in the knowledge discovery process. The major reason that data mining has attracted a great deal of attention in the information industry in recent years is due to “We are drowning in data, but starving for knowledge”. It is urgent matter to convert such data into useful information and knowledge. With the increasing developments of computer and network technology, we can easily access the Internet information resources, but the traditional centralized data mining can not meet the needs. Data repositories are large in size, dynamic, and physically distributed
您可能关注的文档
- 典型体积成形工艺碳排放模型研究-材料加工工程专业论文.docx
- 典型农药与对羟基苯甲酸酯的人体暴露研究-环境科学专业论文.docx
- 典型几何特征的数控机床在线测量技术-机械工程专业论文.docx
- 典型体型体育场风荷载风环境CFD数值模拟分析-结构工程专业论文.docx
- 典型供水金属管材电化学腐蚀及对水质影响的研究-市政工程专业论文.docx
- 典型内陆水体有色可溶性有机物遥感反演-测绘工程专业论文.docx
- 典型分数阶混沌系统若干同步方法分析-控制科学与工程专业论文.docx
- 典型化工污染土壤的微波修复技术研究-环境工程专业论文.docx
- 典型化工设备事故致因机理及其管控研究-工程专业论文.docx
- 典型单相非线性负荷谐波模型及谐波特性研究-电气工程专业论文.docx
- 浙江省温州市浙南名校联盟2025-2026学年高一上学期期中联考数学试题含解析.docx
- 26高考数学提分秘诀重难点34圆锥曲线中的定点、定值、定直线问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点35概率与统计的综合问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点31圆锥曲线中的切线与切点弦问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点30圆锥曲线中的弦长问题与长度和、差、商、积问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点29巧解圆锥曲线的离心率问题(举一反三专项训练)(全国通用)(含解析).docx
- 26高考数学提分秘诀重难点28直线与圆的综合(举一反三专项训练)(全国通用)(含解析).docx
- 寡核苷酸药物重复给药毒性研究技术指南.docx
- 重组溶瘤腺病毒生产质量管理标准.docx
- 26高考数学提分秘诀重难点27直线与圆中常考的最值与范围问题(举一反三专项训练)(全国通用)(含解析).docx
有哪些信誉好的足球投注网站
文档评论(0)