- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
固 商
Web结构挖掘在电子商务网站结构优化l【】的应用
顾海花 南京信息职业技术学院软件学院
江苏省高校自然科学基金项目,项目编号:05KJD510128
摘【 要】本文概述 了Web结构挖掘技术并描述了其常见算法。针对Web结构挖掘算法,提出了提高网站结构合理性的
对策。使用户通过优化网站结构来获取更多有效客户,扩大网站影响力,从而提升 网站价值。
【关键词】Web结构挖掘 网站结构 超链接 PgeP~ank HITS
一 、 前言 年提出了PageRank算法 ,同年J.Kleinberg提出了HITS算法,其他
网站的推广对电子商务网站而言尤为重要。网站在常用有哪些信誉好的足球投注网站 一 些学者也相继提出了另外的链接分析算法,如SALSA PHITS
弓I擎上的排名会直接影响到网站的推广和网站的运营效果。因网 BaYesian等算法。对超链接进行挖掘的两个典型的算法是 :
站的结构不同,即使内容相同.外观相同的网站 在常用有哪些信誉好的足球投注网站引 PageRank算法及HITS算法。
擎中的排名也会不同。网站结构是否合理会影响到有哪些信誉好的足球投注网站引擎在网 1,PageRank算法
站页面上抓取的结果 .从而影响到网站的排名。在实际应用中, PageRank算法是Web超链接结构分析中最成功的代表之一 ,
常使用PR (PageRank)值来判断网站结构是否合理,DR值越高 该算法是评价网页权威性的一种重要工具。Googie、Yahoo、Baidu
说明网站结构越合理,有哪些信誉好的足球投注网站引擎就会收录该网站更多的页面 .为 等都是基于该算法的有哪些信誉好的足球投注网站引擎。PageRank算法基于2个前提,一
网站带来更多的流量。因此,提高网站结构的合理性,获取更高 是若网页A被多次引用 ,则A重要;若 A被重要网页B引用,则
的PR值就显得尤为重要。只有用网站结构优化的理念去设计网 A重要;B的重要性被平均的传递到它所引用的网页。二是若用户
站 .才有可能设计一个成功的网站。基于Web的数据挖掘技术中 访问网页A.然后跟随A的导出链接向后浏览网页B而不退回A.
的Web结构挖掘 (WebStructureMining)则是判断网站结构是 那么浏览B的概率就是B的PageRank值。
否合理的一个有效方法。使用Web结构挖掘方法可以提高网站结 PIageRank在具体实现时会忽略掉页面的文本和其他内容,只
构的合理性,增加网站的PR值.扩大网站的流量。 考虑页面问的超链接。但由于网页的链接范围领域很广,链接的
二、Web结构挖掘的概念 页面价值参差不齐 ,所以仅以简单的链接数量来判断网页的重要
基于Web的数据挖掘是指使用数据挖掘技术在Web数据中发 性是不真实客观的.所以其他研究者对PageRank算法提出了改进。
现潜在的、有用的模式或信息。基于Web的数据挖掘一般可以分 改进的PageRank算法不仅考虑了网页引用数量 .还根据页面的导
为三类:web内容挖掘 W《ebContentMining)、 Web结构挖掘 ( 入链接的权重来计算页面的重要性。页面导入链接的权重 由链接
WebStructureMining)及 Web用法挖掘 (WebUsageMining)。 提供页面的重要性所决定 即当前页面的重要性主要由其他页面
其中Web结构挖掘是对Web的链接结构进行分析 .以对超链接 的重要性来决定 PageRank算法就是从链接结构中获取网页的重
分析来评估Web资源 从而发现有用模式 ,提高有哪些信誉好的足球投注网站质量及提 要性 。
高网站被抓取的可能性。Web结构包括不同网页之间的超链接结 简单PageRank算法描述如下:
构和网页内部用H丁ML,XML表示的树形结构,以及文档URL中 P只{A): (1d)/N q-‘d (PR(T1)/c(T1)7-。..+PR(Tn)/
的目录路径结构等。Web页面之间的链接结构中包含了许多有用 C(Tn))
的信息,Web结构挖掘是从Web结构中推导知识,即对Web文档 其中:PR(A):页面A的PR值 ,
的结构进行挖掘,挖掘Web潜在的链接结构模式 ,通过分析网页
您可能关注的文档
- QT离散度与冠心病患者冠脉造影病变的关系探讨.pdf
- QJ80/301架桥机的技术特点及应用.pdf
- 串联重复序列识别方法研究.pdf
- R&D经费投入对出口商品结构的影响.pdf
- Quantum Chemistry Studies on the Fe-Cu Interactions and 31p NMR in Fe(CO)3(Ph2Ppy)2(CuXn) (Xn = Cl2^2-, Cl-, Br-).pdf
- R-(-)-α-环己基扁桃酸的不对称合成.pdf
- RADIUS认证技术在局域网的应用.pdf
- RBAC模型在物资管理系统中的应用.pdf
- RBAC在门户平台中的设计与实现.pdf
- RBF神经网络方法在斜拉桥中跨合龙中的应用.pdf
- Warezu Qiang Women's Festival.pdf
- WEB2.0对数字图书馆服务的发展影响.pdf
- Western dragon and Chinese Long: Mistranslation and resolution.pdf
- What Prompts the People's Bank of China to Change Its Monetary Policy Stance? Evidence from a Discrete Choice Model.pdf
- WHE抑制地塞米松致大鼠骨质疏松研究.pdf
- WiMAX上行带宽请求机制与分配策略研究.pdf
- Western China-An Artist's Spiritual Home.pdf
- WiMAX与TD-SCDMA联合组网的研究.pdf
- Windows 2003下多种备份还原技术的融合.pdf
- Windows安全的“天空”.pdf
文档评论(0)