[教育]第八章动态规划11-5-17.pptVIP

下载本文档

4
0
约4.83千字
约 36页
2018-03-28 发布于浙江
举报
版权申诉

[教育]第八章动态规划11-5-17.ppt

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

[教育]第八章动态规划11-5-17

动态规划多阶段决策问题最优化原理与动态规划的数学模型动态规划模型的建立与求解多阶段决策问题例1 最短路问题最优化原理与动态规划的数学模型动态规划问题的解题思路动态规划的基本概念最优化原理与动态规划的数学模型动态规划的数学模型：动态规划模型的分类动态规划模型的建立与求解作业： * * 第八章动态规划北京物资学院运筹学教学课件北京物资学院信息学院 2011-5-8 动态规划是一种研究多阶段决策问题的理论和方法。多阶段决策问题是指一类活动过程，它可以分为若干个相互联系的阶段，在每个阶段都需要作出决策。这个决策不仅决定这一阶段的效益，而且决定下一阶段的初始状态。策略：每个阶段的决策确定以后，就得到一个决策序列，称为策略。多阶段决策问题就是求一个策略，使各阶段的总效益达到最优。设有一个旅行者从下图中的A点出发，途中要经过B、C、D等处，最后到达终点E。从A到E有很多条路线可以选择，各点之间的距离如图所示，问该旅行者应该选择哪一条路线，才能使从A到达E的总行程最短？ A B1 B2 B3 C3 C2 C1 D1 D2 E 2 5 3 7 5 6 3 2 4 5 1 5 1 4 6 3 3 3 3 4 状态A 决策阶段1 状态B1 阶段2 决策状态D1 状态C3 阶段3 决策阶段4 决策状态E 行程1 行程2 行程3 行程4 例2 多阶段资源分配问题设有某种机器设备，可用于完成两类工作A和B。若第k年初完好机器的数量为sk,若以数量xk用于工作A，余下的sk- xk用于工作B，则该年的预期收入为g(xk)+h(sk- xk)，其中g(xk) 和h(sk- xk) 是已知函数，并且g(0)=h(0)=0。又机器设备在使用中会有损坏，设机器用于工作A时，一年后能继续使用的完好机器数占年初投入量的a倍（0a1），若用于工作B时，一年后能继续使用的完好机器数占年初投入量的b倍(0b1)，即下一年初能继续用于完成这两项工作的机器数为sk+1=axk+b(sk- xk)。设第一年初完好的机器数为s1，问在连续三年内，每年应如何分配用于A、B两项工作的机器数，才能使三年的总收益达到最大。状态S1 决策第一年阶段1 状态S2 第二年阶段2 决策状态S4 状态S3 第三年阶段3 决策收益1 收益2 收益3 动态规划问题的解题思路动态规划的基本概念最优化原理与动态规划的数学模型动态规划模型的分类思路：将一个n阶段的决策问题转化为依次求n个具有递推关系的单阶段决策问题，从而简化计算。在例1中，这种转化的实现是从终点E出发一步步进行反推（逆序算法）（1）考虑一个阶段的选择。到达E之前，上一步必然到达D1或D2， D1到E的最优策略是：D1?E，距离d(D1,E)=3,记 f(D1)=3. D2到E的最优策略是：D2?E，距离d(D2,E)=4,记 f(D2)=4. 1 A B1 B2 B3 C3 C2 C1 D1 D2 E 2 5 3 7 5 6 3 2 4 5 1 5 4 6 3 3 3 3 4 (2)联合考虑两个阶段的最优选择。当旅行者离终点还有两站时，他必然处在C1，C2或C3的某一点上。 C1到终点的路有两条：C1?D1?E， C1?D2?E，旅行者从这两条路线中选最短的一条，并且不管是经过D1或D2，到达该点后，他应循着从D1或D2到E的最短路线继续走。因此从C1到E的最短路程为：即从C1到E的最短路线为C1?D1?E，记如果从C2出发如果从C3出发（3）再联合起来考虑三个阶段的最优选择。从B1点出发的最优选择为从B2点出发的最优选择为从B3点出发的最优选择为（4）四个阶段联合考虑时从A到E的最优选择。从A到E的最短路线为A?B3?C2?D2?E，距离为11。 1 A B1 B2 B3 C3 C2 C1 D1 D2 E 2 5 3 7 5 6 3 2 4 5 1 5 4 6 3 3 3 3 4 3 4 4 7 6 11 7 8 11 以上计算过程可以在图上通过标号法实现 1. 阶段(stage)：指一个问题需要作出决策的步数。通常用k表示问题的阶段数。阶段一般是根据时间和空间的自然特征来划分的。 2. 状态(state)：表示每个阶段开始所处的自然状况或客观条件，它描述了研究问题过程的状况，是动态规划中最关键的一个参数。它既反映前面各个阶段决策的结局，又是本阶段决策的出发点和依据。它是动态规划问题各个阶段信息的传递点和结合点。通常一个阶段有多个状态。如例1中第一阶段有1个状态，A. 第三阶段有三个状态C1,C2,C3。状态变量：描述状态的变量。可以是数、数组或向量。通常用Sk表示k阶段的状态集