基于时间序列的服务器负载预测.docVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于时间序列的服务器负载预测

基于时间序列的服务器负载预测 简介:1 引言随着计算机网络的迅速发展,各种服务器越来越难以满足用户的需求。负载均衡集群的出现,在一定程度上解决了这个问题。负载均衡算法作为影响负载均衡的三大要素之一,它的好坏在很大程度上决定了负载均 ... 关键字:时间序列 服务器 负载预测 1 引言 随着计算机网络的迅速发展,各种服务器越来越难以满足用户的需求。负载均衡集群的出现,在一定程度上解决了这个问题。负载均衡算法作为影响负载均衡的三大要素之一,它的好坏在很大程度上决定了负载均衡集群的性能。但是目前负载均衡集群大多采用的是静态的负载均衡算法,由于这种算法没有考虑到服务器的当前负载情况,很难做到真正的负载均衡;当然也有一些负载均衡集群采用的是动态负载均衡算法,这种算法一方面使各个服务器之间的负载更加均衡,但另一方面又造成了服务器的资源的巨大浪费,因为各个服务器要在很小的时间间隔内(甚至是实时的)就要向前端调度器发送自身的负载信息。基于以上原因,本文提出了基于时间序列的服务器的负载预测方法。目前,国内外利用时间序列等其他方法进行预测的研究主要集中在网络流量的预测上,对服务器负载预测研究的相对较少。这两者的不同主要在于:网络流量预测关心的是TCP/IP流量大小和延迟,而服务器负载预测关心的是服务器的平均负载量,这是一个服务器消耗资源的综合体,包括CPU利用率、网络利用率、内存使用情况以及硬盘可使用空间。文献[1]提出了基于ARMA模型的网络流量预测的方法,但是它并没有为实际序列寻找拟合最好的时间序列,而是采用了ARMA(2, 1)序列。这样虽然减少了计算量,但同时也降低了预测的准确性。本文根据服务器负载的特性以及负载动态变化的规律,提出了基于时间序列的负载预测方法。该方法是以服务器的历史负载数据为基础,首先对负载数据进行预处理剔除误差较大的数据,再对进行预处理的序列进行平稳化处理、剔除趋势项和周期项,得到随机项序列;接下来对随机项序列进行模型识别,确定是时间序列的三种模型中的哪一个模型;接着对选定的模型进行定阶,确定其中的p、q的大小;再对模型中的参数进行估计、同时对模型进行考核;然后利用得到的模型对负载进行预测,最后对负载预测的结果进行了分析,结果显示预测效果较好。因此,此方法不仅为实现高效的负载均衡打下了基础,而且提高了服务器的资源利用率。 2 负载特性 为了能够进行准确的负载预测,就要知道如何准确的衡量负载,即要了解负载的特性。美国卡内基梅隆大学的Peter A. Dinda在1997年和1998年分两次对38台不同的机器,包括集群服务器、计算服务器和桌面主机等进行长期的跟踪抽样,获得了大量的负载图样。通过对这些图样进行统计分析,Dinda总结出了负载的特性,这些研究成果收录于文献[2]。从这篇文献中,可以得出负载的特性主要有以下七个方面: (1) 负载的变化是一种随机过程。 (2) 负载一般处于较低的水平,但具有很强的波动性。 (3) 平均负载量高的其负载的绝对波动量也大,即其最大负载量与最小负载量间的差值大;但从相对波动量来说,平均负载量高的要低于平均负载量低的。这种最大负载量与平均负载量的关联性表明对重负载机器进行负载预测有更高的价值。 (4) 负载值的分布是比较复杂的,尤其是平均负载量高的,其负载值呈现复合多样性。这种分布复杂性表明对负载进行分析、预测应该是图样驱动,而不能简单的依据分布曲线。 (5) 负载随时间变化有很强的关联性,即过去的负载值对将来的负载值有很大的影响。这表明依据过去的负载值对将来的负载值有很大的影响,同样依据过去的负载值进行负载预测是可行的,而且利用时间序列模型进行负载预测是合适的。 (6) 负载的变化又有高度的自相似性,即在所有的时间尺度下负载的变化既复杂,又具有长期的依赖性,所以负载的模型化和预测是困难的。 (7) 负载的变化又具有突变性。负载值在某一个时刻会有比较大的波动,然后又趋于平稳。负载的这种突变性表明负载预测应具有修正和重适应机制。 3 时间序列 由上一节可知,服务器负载的变化是一种时间序列,而且具有高度的自相似性,因此利用时间序列对服务器的负载进行预测是可行的。 时间序列是按时间次序排列的随机变量序列。任何时间序列经过合理的函数变换后都可以被认为是由趋势项部分、周期项部分和随机噪声项部分等三部分叠加而成的。它主要包括自回归模型AR(p)、

文档评论(0)

xcs88858 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档