[计算机]Web挖掘在网上购物中的应用研究.pdfVIP

下载本文档

2
0
约7.55千字
约 3页
2018-12-01 发布于浙江
举报
版权申诉

[计算机]Web挖掘在网上购物中的应用研究.pdf

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

[计算机]Web挖掘在网上购物中的应用研究

维普资讯 2004年 11月安庆师范学院学报 (自然科学版) Nov．2004 第 1O卷第 4期 JournalofAnqlngTeachersCollege (NaturalScience) VoI．10NO．4 Web挖掘在网上购物中的应用研究叶彩虹 (湛江师范学院数学与计算科学学院，江西湛江 524048) 摘要：Internet的迅速发展，使得WorldWideWeb已成为一个巨大的信息资源库，为Web挖掘研究提供了丰富的信息资源，同时也提出了新的挑战。该文首先概述了数据挖掘和Web挖掘的概念、挖掘流程及算法，然后介绍了电子商务及网上购物的概念及现状，并结合具体实例讨论分析了Web挖掘在网上购物中的应用。关键词；知识发现；数据挖掘；Web挖掘；电子商务；网上购物；电子商店中图分类号：TP393 文献标识码：A 文章编号：1OO7—4260(2004)04—0109一O3 1数据挖掘的基本流程及主要算法数据挖掘，简单来说，就是在 “数据矿山”中找到蕴藏的 “知识金块 ”。数据挖掘是一种从大型数据库或数据仓库中提取隐藏的预测性信息的新技术。它能开采出潜在的模式，找出最有价值的信息，指导商业行为或辅助科学研究。数据挖掘有两个重要特征：发掘和预测。发掘是指在数据库中搜索到有用的 “天然金块 ”；预测是指运用所发现的信息来预测到下一步会发生什么。数据挖掘的基本流程是：数据取样；数据探索；数据调整；模型化；评价。数据挖掘的主要算法及技术如下： 1)关联规则 (Affinitygroupingorassociationrules)：关联规则就是发现事物之间的意义的联系和规则。关联可分为简单关联、时序关联、因果关联。典型的关联规则发现算法是 Apriori算法，也称为广度优先算法，是 R．Agrawal和 R．Srikant于 1994年提出的，其基本思想是：如果一个项集不是频繁集，则其父亲也不是频繁集，由此大大地减少了需要验证的项集的数目。 2)数据聚类 (Dataclustering)：聚类是指在事先不规定分组规则的情况下，将数据按照其自身特征划分成不同的群组。分组基于的原理一般是：最大的组内相似性与最小的组间相似性。其基本思想是：对数据进行分析的过程中，在考虑数据间 “距离”的同时，更侧重考虑某些数据间具有类的共同内涵。聚类方法包括统计方法、机器学习方法、神经网络方法和面向数据库的方法。 3)分类规则 (Classificationrules)：数据分类是基于一组数据的某些属性的值进行的。数据分类的方法很多，包括决策树方法、统计学方法、神经网络方法、最近邻居方法等。最为典型的分类方法是基于决策树的分类方法。它是从实例集中构造决策树，是一种有指导的学习方法。该方法先根据训练-y-集 (又称为窗口)形成决策树。如果该树不能对所有对象给出正确的分类，那么选择一些例外加入到窗口中，重复该过程一直到形成正确的决策集。最终结果是一棵树，其叶结点是类名，中间结点是带有分枝的属性，该分枝对应该属性的某一可能值。 4)数据总结：数据总结目的是对数据进行浓缩，给出它的紧凑描述。数据泛化是一种把数据库中的有关数据从低层次抽象到高层次上的过程。。数据泛化目前主要有两种技术：多维数据分析方法和面向属性的归纳方法。 2．W ebj宅掘 Web挖掘是数据挖掘的一个分支，近几年发展比较活跃。互联网的迅猛发展，使得 WorldW ide Web 已经成为一个巨大的，蕴涵着具有潜在价