- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[计算机]Web挖掘在网上购物中的应用研究
维普资讯
2004年 11月 安庆师范学院学报 (自然科学版) Nov.2004
第 1O卷第 4期 JournalofAnqlngTeachersCollege (NaturalScience) VoI.10NO.4
Web挖掘在网上购物中的应用研究
叶 彩 虹
(湛江师范学院 数学与计算科学学院, 江西 湛江 524048)
摘 要:Internet的迅速发展,使得WorldWideWeb已成为一个巨大的信息资源库,为Web挖掘研究提供
了丰富的信息资源,同时也提出了新的挑战。该文首先概述了数据挖掘和Web挖掘的概念、挖掘流程及算法,然
后介绍了电子商务及网上购物的概念及现状,并结合具体实例讨论分析了Web挖掘在网上购物中的应用。
关键词 ;知识发现 ;数据挖掘;Web挖掘;电子商务;网上购物;电子商店
中图分类号:TP393 文献标识码:A 文章编号:1OO7—4260(2004)04—0109一O3
1数据 挖掘 的基 本流程及主要算 法
数 据挖掘 ,简单来 说 ,就是在 “数据 矿 山”中找 到蕴藏 的 “知识金块 ”。数据挖 掘是 一种从大 型数据库
或数据仓库 中提取 隐藏 的预测性信 息的新技术 。它能开采 出潜在的模式 ,找出最有价值的信 息 ,指导商
业 行为或辅 助科 学研 究 。数据挖掘 有两个重要 特征 :发掘和预 测 。发掘是指 在数据库 中搜 索到有用 的
“天然金块 ”;预测是指运用所发现的信息来预测到下一步会发生什 么。数据挖掘 的基本流程是 :数据取
样 ;数据探 索 ;数据调整 ;模型化 ;评价 。数 据挖 掘的主要算法及 技术如下 :
1)关联规 则 (Affinitygroupingorassociationrules):关联规则就是 发现事 物之 间的意义 的联系和
规则 。关联可分为简单关联 、时序 关联、因果关联 。典型 的关联规则发现算法是 Apriori算法 ,也称为广
度优先算法 ,是 R.Agrawal和 R.Srikant于 1994年 提 出的 ,其基本 思想是 :如果一 个项 集不是频 繁集 ,
则其父亲也 不是频繁集 ,由此大 大地减少 了需要验证 的项集 的数 目。
2)数据 聚类 (Dataclustering):聚类是 指在事先不规 定分组规则 的情况 下 ,将 数据按 照其 自身特征
划分成不 同的群组 。分组基于的原理一般是 :最大 的组 内相似性与最小 的组间相似性 。其基本 思想是 :
对数据进行分 析 的过程 中 ,在考 虑数据 间 “距离”的同时 ,更侧 重考虑某些数据 间具有类 的共 同内涵 。聚
类方法包括 统计方法 、机器学 习方法 、神经 网络方法和面 向数据库 的方法 。
3)分类 规则 (Classificationrules):数据分 类是基 于一组数据 的某些属 性的值进 行 的。数据分类 的
方法很多 ,包括决策树方法 、统计学方法 、神经 网络方 法 、最近邻居方法等 。最为典型 的分类方法是基 于
决策树 的分 类方法 。它是从 实例集 中构造 决策树 ,是一种 有指导 的学 习方法 。该 方法先根据 训练-y-集
(又称为 窗 口)形成决策树 。如 果该树不 能对所有对 象给 出正确 的分类 ,那 么选 择一些 例外加入到窗 口
中,重复该过程一直到形成正确 的决策集 。最终结果是一棵树 ,其叶结点是类名 ,中间结点是带有分枝
的属性 ,该分枝对 应该属性 的某一可能值 。
4)数据总结 :数据 总结 目的是对数据进 行浓缩 ,给出它 的紧凑描述 。数据泛化是一种把数据库 中的
有关数据从 低层次抽 象到高层次上 的过 程 。。数据泛化 目前 主要有两种技术 :多维数据 分析方法 和面 向
属性 的 归纳 方法 。
2.W ebj宅掘
Web挖 掘 是数 据 挖掘 的一 个分 支 ,近 几年 发展 比较 活跃 。互 联 网 的迅猛 发展 ,使得 WorldW ide
Web 已经成 为一个 巨大的 ,蕴涵 着具有潜在价
您可能关注的文档
最近下载
- 新人教版高中数学必修第二册统计全套课件.pptx VIP
- 台球厅消防安全应急预案.docx VIP
- 海外代理协议合同协议.docx VIP
- 初中教科研课题:《初中语文预习方法研究》课题研究工作报告.doc VIP
- 2025至2030年中国新疆维吾尔自治区建筑市场运行态势及行业发展前景预测报告.docx
- 简述10KV 高压配电柜安装.doc VIP
- GB50148-2010 电气装置安装工程电力变压器油浸电抗器、互感器施工及验收规范.pdf VIP
- 2025航天恒星科技有限公司招聘80+人笔试历年参考题库附带答案详解.pdf
- RB∕T 174-2021 司法鉴定法庭科学机构能力专业要求.pdf
- CP-717安装指南.doc VIP
文档评论(0)