动态规划模型的建立 - 幻灯片1.pptVIP

下载本文档

7
0
约2.65千字
约 30页
2018-04-01 发布于江西
举报
版权申诉

动态规划模型的建立 - 幻灯片1.ppt

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

动态规划模型的建立 - 幻灯片1

§5.2 动态规划模型的建立下面以资源分配问题为例介绍动态规划的建模过程。资源分配就是将一定数量的一种或几种资源恰当地分配给使用者，以获取最大效益。资源可以是资金、原材料、设备或劳动力等。例5.2.1（资源分配问题）某公司有资金10万元，若投资于项目的投资额为时，其收益分别为问应如何分配投资数额才能使总收益最大？分析：这是一个与时间无明显关系的静态最优化问题，可列出其静态模型。目的是求使并且满足约束条件为了应用动态规划方法求解，我们可以人为地赋予它“时段”的概念。将投资项目排序，依次考虑项目1、项目2和项目3的投资，即把问题划分为三个阶段，每个阶段只决定对一个项目应投资的金额。这样问题转化为一个三阶段决策问题。题是如何正确选择状态变量，接下来的问具有递推关系。使各后部子过程之间通常可以把决策变量态问题中的变量定为原静即令状态变量和决策变量有密切关系，为累计量或随递推过程变化的量。即状态变量一般段可供使用的资金定为状态变量这里可以把每阶初始状态为可分配用于第一种项目的最大资金，则当第一阶段（k=1）时，有第二阶段（k=2）时，状态变量其余两个项目的资金，即为余下可投资于一般地，第k时段于是本例中有：阶段k： k =1，2，3，4；状态变量第k段可以投资于第 k项到第3个项目的资金。决策变量决定给第k个项目投资的资金。状态转移方程：指标函数：最优指标函数当可投资金为时，投资第 k-3项所得的最大收益。基本方程为：用动态规划方法逐段求解，便可得到各项目最佳投资金额，就是所求的最大收益。建立动态规划模型的步骤： ①划分阶段：按时间或空间的顺序适当地将过程划划成若干个相互联系的阶段； ②确定状态变量及其取值范围：决策过程演变的状态，又要满足无后效性的要求，状态变量要能描述而且维数要尽可能地少。 ③确定决策变量及其取值范围： ④建立状态转移方程： ⑤建立动态规划的基本方程。 §5.3 动态规划的求解两种基本方法逆序解法：顺序解法：寻优的方向与多阶段决策过程的实际行进方向相反，从最后一阶段开始计算，逐段前推，求得全过程的最优策略寻优方向与多阶段决策过程的实际行进方向相同，从第一阶段开始计算，逐段向后递推，计算后一阶段要用到前一阶段的寻优结果，最后一段计算的结果即为全过程的最优结果因为逆序解法前已提及，所以这里我们只讨论顺序解法，仍以例5.1.1为例，因为该问题的始点A与终点 E都是固定的，计算由A点到E点的最短路径与由E点到A点的最短路径应当一样，所以若用表示从起点A到第k阶段状态的最短距离，则可以从前向后逐步求出起点A到各阶段起点的最短距离，最后求出从A点到 E点的最短距离及最短路线，计算过程如下： k=0时，即为边界条件。 k=1时，按的定义有： k=2时， A B1 B2 B3 C1 C2 C3 D1 D2 E 图5.1.2 k=3时，或或 k=4时，按定义可知为所求的最短路长，而最短路径则为 A B1 B2 B3 C1 C2 C3 D1 D2 E 图5.3.1 与前节逆序解法结论相同，全部计算情况如图5.3.1 图中每节点上方括号内的数表示该点到A点的最短距离。上述解法可写成如下递推方程：这里顺序解法和逆序解法的区别： 1．状态转移方式不同逆序解法状态转移方程顺序解法顺序转移方程逆序转移方程 n n 1 k 图5.3.3 顺序解法 1 k 图5.3.2 逆序解法 2．指标函数的定义不同逆序解法：最优指标函数逆序解法：最优指标函数第k阶段从状态出发，到终点后部子过程最优效益值。第k阶段时从起点到状态的前部子过程最优效益值。整体最优函数值：整体最优函数值： 3．基本方程形式不同逆序解法：顺序解法： ①指标函数为阶段指标和形式 ②指标函数为阶段指标积形式逆序解法：顺序解法：当动态规划模型中状态变量与决策变量为连续变量时，则可灵活选取求解方法，法、非线性规划方法、经典解析方法或者其它数如线性规划方值方法等。如例5.2.1，状态变量和决策变量均取连续值。这里我们分别采用逆序解法和顺序解法来求解。 1．用逆序解法求解由前面分析知，该问题为三阶段决策问题第k段