基于日志分析的有哪些信誉好的足球投注网站引擎查询结果缓存研究.pptVIP

基于日志分析的有哪些信誉好的足球投注网站引擎查询结果缓存研究.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于日志分析的有哪些信誉好的足球投注网站引擎 查询结果缓存研究 马宏远 王斌 ICTIR * 引言 网民增多,对有哪些信誉好的足球投注网站引擎的使用日益频繁。同时互联网网页的规模也在不断膨胀。 有哪些信誉好的足球投注网站引擎需要尽可能多的索引网页并迅速提供查询结果。 缓存通过复制频繁请求的数据到速度较快的存储层次,使后续相同的请求得以快速访问,并减少服务器的系统负载。 * 1.主要工作 对sogou有哪些信誉好的足球投注网站引擎一个月的用户查询日志进行分析,研究其面向缓存应用的工作负载特性。 通过实验和分析,研究缓存设置对有哪些信誉好的足球投注网站引擎系统优化的贡献。 这是在中文商业有哪些信誉好的足球投注网站引擎环境下,第一次对有哪些信誉好的足球投注网站引擎缓存特性进行分析。 * 2.有哪些信誉好的足球投注网站引擎查询结果缓存特性分析 本文中性能特性的衡量指标是命中率(Hit) Hit=Requstcache / Requst# * 命中缓存的查询 所有查询 2.有哪些信誉好的足球投注网站引擎查询结果缓存特性分析 系统平均访问时间 Taccess=Hit*T1 + (1-Hit)*T2 T1 为缓存访问时间, T2 为磁盘访问时间 有 T1 T2 * 2.1 局部性 计算机在较短时期内,程序访问局限在一定区域。这只是一种经验性质,不能保证成立,但可能性通常很高。 查询的词符合Zipf定律,即一个单词出现的频率与它在频率表里的排名成反比。 * 2.1 局部性 对查询日志的分析 * 查询频率(次数) 查询词按照查询频率的排序 频率最高的20%查询 占据了80.45%的查询请求量 * 查询频率(次数) 查询词按照查询频率的排序 用搜狗实验室中,sogou有哪些信誉好的足球投注网站引擎2008.8.26的53万查询数据实验,也能得出相同结果 2.2 查询结果缓存策略 分为静态策略和动态策略 静态策略是离线方法。通过对用户查询日志的频率统计,将频率最高的一部分查询结果放到缓存中。 动态策略是在线方法。缓存的容量是固定的,随着时间推进,当所存的内容超过缓存容量时,就需要到替代算法。 最常用的算法即为LRU(最近最少使用算法) * * 2.2 查询结果缓存策略 命中率(%) 缓存容量(千个查询词) 以8月23日的用户查询日志作为历史信息 8月24日的用户查询日志作为测试集 动态策略 静态策略 实验: * 2.2 查询结果缓存策略 命中率(%) 缓存容量(千个查询词) 结论1:随着缓存容量的增大,无论静态策略还是动态策略,都会获得较好的命中率 。 结论2:动态LRU策略比基于历史信息的静态策略具有更好的命中率,因为8月23日的查询集合和8月24日的查询集合重复度不高。 动态策略 静态策略 * 在《On caching search engine query results》(Markatos,2001)中,则有如下结果 命中率(%) 缓存容量(MB) LRU 静态策略 SLRU 两种缓存策略的对比 静态缓存策略只存下热门的查询;而动态缓存策略存的是最近所发生的查询,也许这些查询并不是很热门。 查询热点瞬息万变,而静态缓存里的查询都提取自历史信息,时效性可能会跟不上,在查询热点词时效果不好。 如近期有哪些信誉好的足球投注网站“斯巴达”、“张高丽”等热点词,如果静态缓存所依赖的历史信息不够新,则可能无法命中。 * 2.2 查询结果缓存策略 更好的策略:静态和动态混合的缓存策略。 将缓存分割为两块空间:静态缓存依然基于历史信息;动态缓存依然采用动态替换算法。 当一个查询请求到达,首先在静态缓存中查找;如果没有命中,则到动态缓存中查找。 * 2.2 查询结果缓存策略 * 2.2 查询结果缓存策略 继续试验,查询日志同上一个试验 命中率(%) 静态缓存的比例(从0到1) 缓存容量大 缓存容量小 结论1:混合缓存策略相比纯动态策略和纯静态策略,命中率都会得到一定幅度的提升。 * 2.2 查询结果缓存策略 继续试验,查询日志同上一个试验 命中率(%) 静态缓存的比例(从0到1) 缓存容量大 缓存容量小 结论2: 对于大容量缓存,采用混合策略,命中率几乎没有提升。 对于容量相对较小的缓存,则具有明显的效果, 如10K的缓存容量,命中率会比动态策略提升4.45个百分点。 * 2.2 查询结果缓存策略 继续试验,查询日志同上一个试验 命中率(%) 静态缓存的比例(从0到1) 缓存容量大 缓存容量小 结论3(来自 《On caching search engine query results》) : 适中的缓存容量已经能够得到比较好的命中率,一味扩增缓存容量(如大于160K),命中率并不会有太大提高,而且内存中的缓存区也很有限。 * *

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档