- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于模糊关联规则的股票市场交易规则抽取
基于模糊关联规则的股票市场交易规则抽取
????中图分类号:F823 文献标识码:A????随着数据库技术的不断发展,数据库中存储的数据量急剧增加,然而目前蕴含在数据库中丰富的、有价值的信息远远没有得到充分的挖掘和利用。近年来,在数据极为丰富的金融领域,数据挖掘的方法,如神经网络、模糊逻辑、粗糙集、支持向量机等,正在得到越来越广泛的研究与应用[1~5],使得“从海量数据中提取或识别有效的、新颖的、潜在有用的并最终可理解的模式”成为可能。????当前,股票数据挖掘的研究主要集中在4个方面:相似序列匹配、股票价格预测、交易规则抽取以及时间模式发现。Wang将模糊关系模型分别与粗糙集和灰度理论相结合,对股票的高频交易数据进行了预测和分析[2,3],随后又通过模糊微分预测模型建立了股票价格的实时预测器[5]。????由于上市公司存在直接或间接的合作、竞争等关系,因此某些股票价格在一定时间内会出现相似或相反的趋势。挖掘这些数据可得到股票之间的内在关联关系,有利于投资者了解各种股票的走势及股票之间的关系,进一步分析上市公司的政策和方案,从而做出正确的投资决策。????本文在已有相关研究的基础上,将模糊数据挖掘技术应用于股票市场的交易规则抽取,对数据库属性处理不采用区间划分法,而采用模糊概念对其进行抽象概括,使得最终挖掘出的规则表示自然、简明、易于理解。本文以模糊集理论为基础,首先根据股票时间序列本身特性以聚类方法为基础对模糊集属性域进行离散化,根据聚类将属性域划分后构造正规模糊集的支集及核,产生模糊集的隶属函数,提出适合股票交易规则提取的模糊关联规则算法FARS。最后本文将算法应用于沪深股市A股股票的规则预测,并进行了检验。结果显示,本文所得规则较原有传统关联规则挖掘出的规则能很好地反映股票的实际情况,并且能获得更多有用信息。????一、基于模糊概念的关联规则????关联规则是当前数据挖掘研究的主要领域之一。自从1993年美国IBM Almaden研究中心的Rakesh Agrawal等提出在交易数据库中挖掘项集间的关联规则问题后[6],学者们对关联算法进行了大量的讨论和研究,提出了很多算法,如Apriori[6]、TreeProjection[7]、FP-Tree及其改进算法[8~10]等。大部分的关联规则挖掘算法使用支持度—置信度标准,即支持度(Support)和置信度(confidence)。对于规则,Support=P(A∪B),Confidence=P(B|A)尽管使用最小支持度和置信度阀值排除了一些“无趣的”关联规则的探查,但仍然会产生一些对用户来说不感兴趣的规则[11]。????由于客观世界的多样性和复杂性,许多事物需要借助模糊概念进行表示。模糊理论是Zadeh于1965年提出的,是当前描述模糊现象的一种最主要的数学方法[12]。模糊概念的数学表示就是模糊集合论,其不明确的内涵与外延用隶属函数定量描述,模糊概念实际上是在一定论域中的一些模糊集合。????????利用模糊概念表示的关联规则也称为模糊关联规则,Chan等提出了算法P-APACS[13],即采用一个有意义的客观的度量方法决定规则兴趣度,使得该算法在发现实际数据库中的规则非常有效,但其仅仅只能发现两个模糊项的关联规则。Kuok等将模糊关联规则定义为“如果X是A,则Y是B”的形式,其中X和Y是互不相交的属性子集,A和B是分别对应于X和Y中属性的模糊集集合[14]。这样的规则形式对股票规则中多维关系的发现具有很大的帮助。以下是模糊关联规则定义及其兴趣性度量方法。????????二、模糊集算法构造????(一)聚类方法的选择????对原始数据库中数据进行预处理后,文中选用聚类方法对量化属性值进行离散化,求出各聚类中心,然后进行隶属函数的构造。使用聚类方法对预处理后的数据进行离散化,可以缩短后续算法中的计算量,降低复杂性,也能更好地构造隶属函数。最常用的聚类方法有k-Means、k-Medoids、BIRCH、 CURE、DBSCAN等。本文根据股票行情数据库大小,以及存在噪声和例外数据的情况选取k-Medoids聚类算法作为进行离散化的聚类方法。????k-medoids聚类算法的基本策略就是首先通过任意为每个聚类找到一个代表对象(medoid)而首先确定n个数据对象的k个聚类(也需要循环进行);其它对象则根据它们与这些聚类代表的距离分别将它们归属到各相应聚类中(仍然是最小距离原则)。而如果替换一个聚类代表能够改善所获聚类质量的话,那么就可以用一个新对象替换老聚类对象。这里将利用一个基于各对象与其聚类代表间距离的成本函数来对聚类质量进行评估[15]。????k-medoids聚类算法如算法1所示。????算法1 (k-med) 根据聚类的
您可能关注的文档
- 国考各部分真题——逻辑.doc
- 国美、华晨合作方案.ppt
- 国菜汁营销策划.doc
- 国石工坊连锁加盟体系手册.doc
- 国金中期策略会机械行业 - 欢迎来到中金集团.ppt
- 国防科技大学博士课件linuxvi与Shell入门.ppt
- 国贸实训答案 TMT.doc
- 国际三字代码表--飞机电子客票.doc
- 国际企业-必胜客.ppt
- 国际债券发行问题.ppt
- 5.3.1函数的单调性(教学课件)--高中数学人教A版(2019)选择性必修第二册.pptx
- 部编版道德与法治2024三年级上册 《科技提升国力》PPT课件.pptx
- 2.7.2 抛物线的几何性质(教学课件)-高中数学人教B版(2019)选择性必修第一册.pptx
- 人教部编统编版小学六年级上册道德与法治9 知法守法 依法维权(第一课时)课件.pptx
- 三年级上册品德道德与法治《学习伴我成长》.pptx
- 部编版小学道德与法治六年级上册6 人大代表为人民 课件.pptx
- 部编版小学道德与法治六年级上册1感受生活中的法律第一课时课件.pptx
- 2.5.2圆与圆的位置关系(教学课件)-高中数学人教A版(2019)选择性必修第一册.pptx
- 2.5.1直线与圆的位置关系-(教学课件)--高中数学人教A版(2019)选择性必修第一册.pptx
- 14.1.1 同底数幂的乘法(教学课件)-初中数学人教版八年级上册.pptx
文档评论(0)