- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
新闻文本为非结构化数据,属于影响股票市场的定性指标,要想分析其对股市的影响,首先需要将此信息量化。 量化此信息的第一步为文本向量化。每篇新闻文本都可以用一个向量来表示。这样,多篇文本就可以表示成一个文档-词矩阵。 横坐标对应文档,纵坐标对应词表,矩阵的每个元素对应一个词在文档中权重,例如,。。。加权方法有很多种,词的个数、词频等等。 more than words这篇文章加权是采用情感词对应的词频。这并不合理。 例如,一个情感词在很多文章中都出现,另一个情感词在少数文章中出现,则前一个情感词肯定没有后一个情感词对股票市场的影响大。所以我们采用TFIDF加权方法对其改进。 第t季度:每个公司的数据对应一条记录,在深交所上市的共有300多个公司,即,有300条记录。用这300条数据做如上方程的回归。 * 从表可得知,(1)上海市场在新闻发布的t日到t+2日,公司规模并没有显著反应,而换手率在1%的水平上显著,即,新闻发布后,无论公司规模大小,上海市场的反应都很热烈,且随着新闻发布的时间延长,从t+3日后规模变量表现得越来越显著,说明不同规模的公司会有不同的反应。而深圳市场公司规模变量一直都没有表现出任何水平上的显著性,但换手率一直保持了较高水平的显著性,即,深市上市公司新闻发布对股价的冲击与其自身的规模并没有太大的关系;(2)深圳市场的新闻变量在1%的水平上显著。t日的新闻变量的系数为-0.235,表示每当报道一篇新闻,就会对股价产生0.235个单位的负向异动。而这种异动在t日表现最大,对股价的冲击力度最强,因为在t日之后的5天里新闻变量的系数绝对值均小于0.235,并且呈递减趋势。相比而知,上海市场t日的新闻变量仅在10%的水平上表现了显著性。但是随后的t+1日,在1%的水平上非常显著,并且模型的拟合程度也达到了最高(adj.R2=0.441)。分析得知,上海市场在新闻发布后的第一天,新闻引起股价产生了-0.09个单位的变化。接下来的t+2日到t+5也表现了一定的显著性,新闻的影响力度大约在0.09个单位左右。从而得知,对于规模越大的企业,新闻发布后的影响力越不明显,对于规模越小的公司,新闻的影响越大持续时间越长,并且,沪深两市新闻影响力的持续时间不同,沪市上市公司的新闻影响力度和持续时间小于深市上市公司 * 金融智能与证券市场 Stock Price Time 文本挖掘技术 文本挖掘技术: 1) 文本向量化。 2)加权TFIDF,提取文本量化数据。 研究背景 新闻对股市有影响,这已经是学术界和实业界公认的事实。目前大部分研究主要集中在微观层面,即新闻对个股价格波动的影响 本文利用文本挖掘技术和计量经济学方法,将新闻内容量化为金融资本定价模型中的一个影响因子。首次从宏观层面上,分析互联网新闻信息对中国股市的影响 研究现状-经济学领域(1/2) Mitchell和Mulherin研究发现,道琼斯每日发布的公告数量与股票市场的交易量和股票收益直接相关[4] Fang和Peress 研究了媒体报道与股票横截面收益之间的关系,发现媒体关注度低的股票存在显著的溢价[5] Niederhoffer通过分析《纽约时报》发布的重大新闻标题,对新闻标题的内容进行分类,并且对每个标题对股市的影响评级,研究重大新闻事件对股票市场的影响。他发现重大新闻发布后的第一天,股票市场的反应最强烈[6] 研究现状-经济学领域(2/2) 总结经济学领域研究新闻对股市影响: 只是简单地采用新闻的数量或标题来进行研究分析新闻如何影响股市,忽略新闻文本中大量有价值的软信息 且目前此领域学者进行研究的新闻源主要是报纸杂志等,并没有涉及互联网中海量新闻 原因分析:量化新闻这种无结构的文本信息对股市影响对经济学 领域的学者是个极大的挑战;海量新闻的获取是又一限制因素 研究现状-信息科学领域(1/2) Schumaker, R.P. 和Chen, H. 运用文本挖掘技术,采用支持向量回归 (Support Vector Regression)[7],建立新闻文本与新闻发布20分钟后股价之间的回归模型,来预测新闻对股价影响[8] Xiangyu Tang,Chunyu Yang和Jie Zhou结合文本挖掘技术和时间序列分析方法,建立新闻与股价之间回归模型,预测新闻对股价影响[9] Yuzheng Zhai,Arthur Hsu和Saman K Halgamuge用文本挖掘技术,支持向量回归技术,建立新闻、技术指标与股价之间回归模型,用建立好的模型预测一则新闻发布后对应股价[10] 研究现状-信息科学领域(2/2) 信息科学领域学者对新闻与股市之间关系的研究可以归结如下: 用文本挖掘技术来研究新闻文本与股价之间关系,建立新闻与股价之间的
文档评论(0)