- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
金融数据时间序列相似性度量应用探究
金融数据时间序列相似性度量应用探究 摘要:从应用角度对时间序列数据挖掘中的关键技术-相似性度量-进行了研究。实现了对时间序列的分段线性表示,并将其用于当前主要的几种时间序列距离度量算法。通过将各距离度量算法用于股票收盘数据分析实验,得出实验数据。通过对实验结果的分析并结合各算法的原理,对各方法的适用情况和执行效率进行了分析及比较。通过分析可知,每种算法有自己的特点及适用情况。对于实际应用,应根据实际需求选择合适的距离度量算法。 关键词:时间序列;数据挖掘;分段线性表示;相似性度量;编辑距离 中图分类号: TP391.1 文献标识码:A 文章编号:1009-3044(2013)25-5600-05 近年来,由于计算机技术的提高,人们的生活和工作中积累了大量数据[1],迫切需要从这些海量的数据中提取出有用的信息和知识,以用于相关领域的发展。传统的查询分析难以满足需求,数据挖掘由此应运而生并得到广泛应用。自1993年Agrawal R等人发表关于时间序列相似性查询的研究论文[2]以来,时间序列相似性查询受到广泛重视,成为理论和应用两方面的研究热点。 1 时间序列的定义及表示 1.1时间序列的定义 时间序列(Time Series)是反映某种特征的一个统计指标按时间先后排列而形成的序列。时间序列反映社会经济现象的发展变化过程、发展趋势和速度,可以用来对发展变化规律进行研究,对某些社会经济现象进行预测。 时间序列就是按照时间的顺序随机事件变化发展过程的记录。下面给出时间序列的完整定义。 1.2 时间序列的模式表示 时间序列的模式表示是一种对时间序列进行抽象和概括的特征表示方法,是在更高层次上对时间序列的重新描述。常用的时间序列模式表示方法主要包括:频域表示法,分段线性表示法,符号表示法等。分段线性表示法具有易于理解和操作,且提取的特征比较符合原数据的特征的特点,因此,在实验中,采用分段线性表示法。 分段线性表示(Piecewise Linear Representation,PLR)的基本思想是用K个直线段来近似替代原来的时间序列。这个思想最早可以追溯到1974年Pavlidis和Horowitz等提出的分段线性分割方法[4]。大致来说,PLR方法通过选取序列中的特殊数据点[5]或者视觉重要点(Perceptually Important Point,PIP)[6-7]来提取原时间序列中的特征。 线性回归表示:直线每一段的通过最小二乘法来拟合,相邻段之间一般不连续。 线性插补表示:直线每一段只是简单的开始和结束两点之间相连,相邻段之间收尾相连,因此相邻段是连续的。 一般来说,前者虽然直线每一段不连续,但是与原始数据更为接近,特征提取更符合数据原本面貌。 2 时间序列的相似性度量方法 时间序列的相似性度量:即衡量两个时间序列的相似程度。它是时间序列数据挖掘的基础,因为几乎所有时间序列挖掘算法都涉及到计算序列之间的相似性问题。一般提到相似性度量,都是用相似性距离替代。目前时间序列的相似性度量主要采用:欧式距离,动态时间弯曲距离(DTW),最长公共子序列(LCS),编辑距离等。 2.1 Euclidean Distance欧式距离 2.2 动态时间弯曲距离 3.2 实验结果及分析 由于三种算法度量标准不同,故直接比较三种算法的计算结果不能清晰地说明算法间的不同。为了能够更直观的说明问题,我们将相似性度量算法用于相似性有哪些信誉好的足球投注网站中,并对有哪些信誉好的足球投注网站结果进行效率和准确性两个方面的比较。效率即比较相同的有哪些信誉好的足球投注网站情况下所用时间长短。时间越短,效率越高。准确性指比较相同的有哪些信誉好的足球投注网站情况下的有哪些信誉好的足球投注网站结果。度量标准虽不同,但相似度大小关系应一致。 而每个方面,我们采用两种方式的比较——横向和纵向。 横向比较是指同一种算法,当移动窗口数不同时,有哪些信誉好的足球投注网站的效率与准确性的比较。 纵向比较是指不同的算法,当移动窗口数相同是,有哪些信誉好的足球投注网站的效率和准确性的比较。 在列出比较结果之间,首先介绍一下实验环境。本实验采用Windows XP操作系统,开发语言为C++,开发工具为Visual Studio 2010,数据库为SQL Server 2005。其中,数据为近10年的日K线A股股票数据。实验中主要使用股票日期及收盘价。 下面列出比较结果,其中表4.1是三种算法时间比较,所用数据库是浦发银行10年收盘价(2000-1-12~2012-4-12),用于有哪些信誉好的足球投注网站的时间序列是其中的一段(2010-4-4~2010-7-7)。 从纵向来看,欧式距离由于其算法的简单性,时间消耗也最少,而且与另外两种算法比起来,所花时间只有DTW算法的6.7%,LCS算法的3.4%。因此
您可能关注的文档
最近下载
- 国考行测言语理解成语辨析专项.docx VIP
- 危大工程监理实施细则.docx VIP
- 农业电商新模式:2025年乡村特色农产品直播带货基地运营优化方案.docx VIP
- 员工关系管理(第2版)李新建-第2章 员工关系的确立与劳动合同管理.ppt VIP
- 学习中央城市工作会议精神解读心得体会.doc VIP
- 英语国家社会与文化入门上册(第四版)朱永涛复习笔记考研真题.pdf VIP
- 煤矿采空区岩土工程勘察规范.pdf VIP
- 《GB/T 42124.3-2025产品几何技术规范(GPS) 模制件的尺寸和几何公差 第3部分:铸件尺寸公差、几何公差与机械加工余量》.pdf
- 员工关系管理(第2版)李新建-第15章 员工多元化及多元化员工关系管理.ppt VIP
- 关于医院招聘护理工作人员简章.pdf VIP
有哪些信誉好的足球投注网站
文档评论(0)