云计算环境下具有可变方差的虚拟机价格预测方法文献综述

 2022-11-17 16:36:46

文 献 综 述

1.虚拟机实例价格预测的存在意义及研究现状

近年来,随着移动互联网的兴起,云计算资源的需求激增,越来越多的云计算资源服务提供商开始提供各种类型的云计算服务。国际上较知名的有微软的Azure、亚马逊的AWS等[4]。而在国内,阿里巴巴的ECS、腾讯公司的CVM以及新浪的SAE等虚拟机服务则占据了大片市场,成为许多个人开发者不可或缺的工具,为数以万计的人们提供云计算服务[3]

作为一种特殊商品,虚拟机实例的价格并不是一尘不变的。随着时间变化,虚拟机实例的价格也在一定范围内产生波动。而消费者需要权衡价格、性能和可靠性之间的各种关系[4]。通过对实例历史价格的统计分析,我们期望得到价格的未来走势。随着越来越多的虚拟机商业化,对实例价格走势的分析显得愈加重要和有意义。通过对大量数据的建模分析,虚拟机实例提供商可以更加合理的调控价格,实现利益最大化。而消费者也迫切需要衡量价格、性能和可靠性之间的各种关系,通过统计分析,我们也希望能找到其平衡点[5]

通过历史数据来预测未来走势的行为早已不是什么新鲜事,对于普通的统计分析,我们有一套非常成熟的建模方法。如AR模型、MA模型和ARMA模型等[8]。然而多数的分析方法对历史数据有较高的要求,它们普遍认为历史数据具有较强的规律性,通过寻找这些规律,利用相关数学模型得到预测数据。而我们知道,虚拟机实例价格受到非常多的因素的影响,并不能简单地认为它是有较强规律性的历史数据[5]。相反的,虚拟机实例价格存在一定的随机性,这就使得“找规律”式建模方式不再适用。为此,本课题希望通过利用非平稳时间序列的随机分析来对虚拟机实例价格进行预测。

2.虚拟机实例价格预测方法及数学模型

虚拟机实例的价格作为一种随时间变化的随机变量,在统计学科中我们将其称为时间序列。时间序列是统计学科的一个重要分支。其主要研究随着时间变化的事物发生、发展的过程,寻找事物发展变化的规律,并预测未来的走势[8]

当我们得到一个虚拟机实例的历史价格即观察值序列之后,首先要检验它的平稳性和纯随机性,而这两个值的检验称为时间序列的预处理。根据检验结果,可以将序列分为不同的类型,对不同的类型我们采取不同的分析方法[8]。其中,平稳性是时间序列所具有的一种统计特征,一般情况下有两种定义方式。分别是“严平稳”和“宽平稳”[13]。所谓严平稳,就是一种条件较为苛刻的平稳性定义,其定义了只有当序列的所有统计性质都不会随着时间的推移而发生变化时,该序列才能被认为是平稳的。但是,因为在实践中获得随机序列的联合分布是非常困难的,而且即使知道随机序列的联合分布,计算和应用也相当的不便。所以严平稳时间序列通常只具有理论意义,在实践中用的更多的是条件较为宽松的宽平稳时间序列。宽平稳是使用序列的特征统计量来定义的一种平稳性。它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩(二阶)平稳,就能保证序列的主要性质近似稳定[13]

综上所述,当我们得到虚拟机实例的价格观察值序列之后,首先判断其平稳性。通过平稳性检验,可以把价格观察值序列分为平稳序列和非平稳序列两大类。

对于平稳序列,在统计上,我们通常建立一个线性模型来拟合该时间序列的发展情况,借此来提取其中有用的信息[2]。目前最常用的平稳序列拟合模型是ARMA模型。ARMA模型的全称是自回归移动平均模型,它又可以细分为AR模型、MA模型和ARMA模型三大类[13]

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。