全国大学生统计建模竞赛论文.docVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
全国大学生统计建模竞赛论文

对双色球蓝色球规律性及选号策略研究 摘要:本文研究了双色球蓝色球号码的规律性问题,指出这种规律性是由于蓝色球号码局部的非随机性造成的,提出了“在一定阶段内蓝球的选取并非是完全随机的”假设。引入“频率模式”的概念定义随机变量,并给出其在蓝球号码完全随机的情况下的概率分布利用2003-2011年1200期的数据对随机变量进行检验,假设成立。利用这种局部的非随机性,设计了两种选号策略,使其成功频率稳定大于其理论概率。双色球 非完全随机性 检验1 问题的提出 近年来,越来越多的人开始加入到彩民的队伍中去,双色球、大乐透等彩票奖池也在不断刷新着记录。中奖是每一个彩民的梦想,每一个彩民都希望自己能猜到下一期的开奖号码,或者是能有一种方法可以以较高的概率猜中号码的范围。但是彩票是随机的,高概率对应着大范围,从而投入的本金也就更多。难道彩票真的没有什么规律可寻吗?其实不然,虽然彩票是随机的,但是总有一些非随机性因素在影响着彩票的开奖号码,即使这种影响十分有限,但是它确实是存在的。2 模型假设及检验 总结历年的双色球蓝色球号码,我们发现了这样的规律,有时连续数期的蓝色球号码相同或相近,如图所示 图1 蓝色球规律性示意图 针对这种现象,我们提出热点假设:在一定阶段内,双色球蓝色球号码的产生并非是完全随机的,由于某些非随机的因素的影响,某些号码出现的概率相对较高。这种在一定阶段内出现概率相对较大的蓝球号码,我们称之为这一阶段的热点号码。2.1 热点假设的初步检验 下面我们先假设的合理性,这也是我们提出这种假设的最初思。 从理论上对连续期蓝色球取值相同的概率进行分析。 连续3期开奖号码的蓝色球取值完全不同的概率是 因此连续3蓝色球号码至少有两期相同的概率为; 连续4期开奖号码的蓝色球取值完全不同的概率是 因此连续4期蓝色球号码至少有两期相同的概率为; 连续5期开奖号码的蓝色球取值完全不同的概率是 因此连续5期蓝色球号码至少有两期相同的概率为; 连续6期开奖号码的蓝色球取值完全不同的概率是 因此连续6期期蓝色球号码至少有两期相同的概率为; 连续7期开奖号码的蓝色球取值完全不同的概率是 因此连续7期蓝色球号码至少有两期相同的概率为。如果我们的假设成立,那么实际统计得出的频率应当大于以上的理论值,而且偏离值应当很稳定,因为这种偏离正是由于某些非随机因素导致。实际上,我们03年双色球开办到11年2011070期的共1200期开奖号码,针对第(,)期开奖号码,往后延伸期,统计这期中蓝色球号码的出现频率。如果这期中有两期及以上蓝色球号码相同,我们为第个阶段中出现了同号事件。计算这个阶段中出现同号事件的频率,将实测频率与理论概率比较得到如下结果:表1 连续期出现同号事件的概率比较 实测频率 理论概率 偏离值 偏离值/ 3 19.62% 17.97% 1.65% 0.55% 4 35.51% 33.35% 2.16% 0.54% 5 52.93% 50.01% 2.92% 0.588% 6 68.62% 65.63% 2.99% 0.498% 7 81.99% 78.52% 3.47% 0.496 分析以上结果,我们发现同号事件出现的实测频率总是大于其理论概率,并且随着期数的增大,其偏离值从1.65%逐渐增加到3.47%对此的解释是:可能存在某些蓝色球号码在一定阶段内以相对较大的概率出现。对每一期出现的号码都可以看作是热点号码,下面一定阶段内出现它的概率相对其他号码较高,这个高出来的概率就影响了偏离值的大小,而且这个高出来的概率是可以累加的。当增大时,这其中所包含的热点号码增多,每个号码都有一个相对其它号码出现概率高出的数值,这些数值累加到一起就使偏离值也增加了。观察“偏离值/”的值,在=3,4,5时都在0.54%到0.59%之间,在=6,7时在0.5%左右,这正说明了累加现象是存在的。当=6,7时减少到0.5%左右可以理解为热点号码的吸引力(以相对较高的概率出现)是受距离影响的,在经过一定期数(距离)的传递后,这种吸引力降低。 2.2 热点假设的检验这一节中我们将运用假设检验的方法来对热点假设进行检验。 :双色球蓝色球号码的产生是完全随机的,即符合1-16的离散均匀分布; :双色球蓝色球号码在一定阶段内并非是完全随机的。(这里的阶段是指连续期的开奖活动,本节仅对=5,6的情形进行检验,其余情形类似) 首先对一些需要用到的基本概念进行定义: 定义1连续期的开奖活动称为一个长为的阶段,当一个阶段从第期开始时,称此阶段为阶段。 定义2连续期的开奖号码称为长为的阶段的一组样本,特别的从第期开始连续期的开奖号码称为长为的阶段的一组样本 定义3长为的阶段内的一组样本,对其进行频率统计,将得到的频率由大到小排列,并且

您可能关注的文档

文档评论(0)

75986597 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档