[计算机]Web挖掘在网上购物中的应用研究.pdfVIP

[计算机]Web挖掘在网上购物中的应用研究.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[计算机]Web挖掘在网上购物中的应用研究

维普资讯 2004年 11月 安庆师范学院学报 (自然科学版) Nov.2004 第 1O卷第 4期 JournalofAnqlngTeachersCollege (NaturalScience) VoI.10NO.4 Web挖掘在网上购物中的应用研究 叶 彩 虹 (湛江师范学院 数学与计算科学学院, 江西 湛江 524048) 摘 要:Internet的迅速发展,使得WorldWideWeb已成为一个巨大的信息资源库,为Web挖掘研究提供 了丰富的信息资源,同时也提出了新的挑战。该文首先概述了数据挖掘和Web挖掘的概念、挖掘流程及算法,然 后介绍了电子商务及网上购物的概念及现状,并结合具体实例讨论分析了Web挖掘在网上购物中的应用。 关键词 ;知识发现 ;数据挖掘;Web挖掘;电子商务;网上购物;电子商店 中图分类号:TP393 文献标识码:A 文章编号:1OO7—4260(2004)04—0109一O3 1数据 挖掘 的基 本流程及主要算 法 数 据挖掘 ,简单来 说 ,就是在 “数据 矿 山”中找 到蕴藏 的 “知识金块 ”。数据挖 掘是 一种从大 型数据库 或数据仓库 中提取 隐藏 的预测性信 息的新技术 。它能开采 出潜在的模式 ,找出最有价值的信 息 ,指导商 业 行为或辅 助科 学研 究 。数据挖掘 有两个重要 特征 :发掘和预 测 。发掘是指 在数据库 中搜 索到有用 的 “天然金块 ”;预测是指运用所发现的信息来预测到下一步会发生什 么。数据挖掘 的基本流程是 :数据取 样 ;数据探 索 ;数据调整 ;模型化 ;评价 。数 据挖 掘的主要算法及 技术如下 : 1)关联规 则 (Affinitygroupingorassociationrules):关联规则就是 发现事 物之 间的意义 的联系和 规则 。关联可分为简单关联 、时序 关联、因果关联 。典型 的关联规则发现算法是 Apriori算法 ,也称为广 度优先算法 ,是 R.Agrawal和 R.Srikant于 1994年 提 出的 ,其基本 思想是 :如果一 个项 集不是频 繁集 , 则其父亲也 不是频繁集 ,由此大 大地减少 了需要验证 的项集 的数 目。 2)数据 聚类 (Dataclustering):聚类是 指在事先不规 定分组规则 的情况 下 ,将 数据按 照其 自身特征 划分成不 同的群组 。分组基于的原理一般是 :最大 的组 内相似性与最小 的组间相似性 。其基本 思想是 : 对数据进行分 析 的过程 中 ,在考 虑数据 间 “距离”的同时 ,更侧 重考虑某些数据 间具有类 的共 同内涵 。聚 类方法包括 统计方法 、机器学 习方法 、神经 网络方法和面 向数据库 的方法 。 3)分类 规则 (Classificationrules):数据分 类是基 于一组数据 的某些属 性的值进 行 的。数据分类 的 方法很多 ,包括决策树方法 、统计学方法 、神经 网络方 法 、最近邻居方法等 。最为典型 的分类方法是基 于 决策树 的分 类方法 。它是从 实例集 中构造 决策树 ,是一种 有指导 的学 习方法 。该 方法先根据 训练-y-集 (又称为 窗 口)形成决策树 。如 果该树不 能对所有对 象给 出正确 的分类 ,那 么选 择一些 例外加入到窗 口 中,重复该过程一直到形成正确 的决策集 。最终结果是一棵树 ,其叶结点是类名 ,中间结点是带有分枝 的属性 ,该分枝对 应该属性 的某一可能值 。 4)数据总结 :数据 总结 目的是对数据进 行浓缩 ,给出它 的紧凑描述 。数据泛化是一种把数据库 中的 有关数据从 低层次抽 象到高层次上 的过 程 。。数据泛化 目前 主要有两种技术 :多维数据 分析方法 和面 向 属性 的 归纳 方法 。 2.W ebj宅掘 Web挖 掘 是数 据 挖掘 的一 个分 支 ,近 几年 发展 比较 活跃 。互 联 网 的迅猛 发展 ,使得 WorldW ide Web 已经成 为一个 巨大的 ,蕴涵 着具有潜在价

文档评论(0)

qiwqpu54 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档