- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
.. §6 动态规划模型举例 以上讨论的优化问题属于静态的,即不必考虑时间的变化,建立的模型——线性规划、非线性规划、整数规划等,都属于静态规划。多阶段决策属于动态优化问题,即在每个阶段(通常以时间或空间为标志)根据过程的演变情况确定一个决策,使全过程的某个指标达到最优。例如: (1)化工生产过程中包含一系列的过程设备,如反应器、蒸馏塔、吸收器等,前一设备的输出为后一设备的输入。因此,应该如何控制生产过程中各个设备的输入和输出,使总产量最大。 (2)发射一枚导弹去击中运动的目标,由于目标的行动是不断改变的,因此应当如何根据目标运动的情况,不断地决定导弹飞行的方向和速度,使之最快地命中目标。 (3)汽车刚买来时故障少、耗油低,出车时间长,处理价值和经济效益高。随着使用时间的增加则变得故障多,油耗高,维修费用增加,经济效益差。使用时间俞长,处理价值也俞低。另外,每次更新都要付出更新费用。因此,应当如何决定它每年的使用时间,使总的效益最佳。 动态规划模型是解决这类问题的有力工具,下面介绍相关的基本概念及其数学描述。 (1)阶段 整个问题的解决可分为若干个相互联系的阶段依次进行。通常按时间或空间划分阶段,描述阶段的变量称为阶段变量,记为。 (2)状态 状态表示每个阶段开始时所处的自然状况或客观条件,它描述了研究过程的状况。各阶段的状态通常用状态变量描述。常用表示第阶段的状态变量。个阶段的决策过程有个状态。用动态规划方法解决多阶段决策问题时,要求整个过程具有无后效性。即:如果某阶段的状态给定,则此阶段以后过程的发展不受以前状态的影响,未来状态只依赖于当前状态。 (3)决策 某一阶段的状态确定后,可以作出各种选择从而演变到下一阶段某一状态,这种选择手段称为决策。描述决策的变量称为决策变量。决策变量限制的取值范围称为允许决策集合。用表示第阶段处于状态时的决策变量,它是的函数,用表示的允许决策集合。 (4)策略 一个由每个阶段的决策按顺序排列组成的集合称为策略。由第阶段的状态开始到终止状态的后部子过程的策略记为。在实际问题中,可供选择的策略有一定范围,称为允许策略集合。其中达到最优效果的策略称为最优策略。 (5)状态转移方程 如果第个阶段状态变量为,作出的决策为,那么第阶段的状态变量也被完全确定。用状态转移方程表示这种演变规律,写作, (6)最优值函数 指标函数是系统执行某一策略所产生结果的数量表示,是用来衡量策略优劣的数量指标,它定义在全过程和所有后部子过程上。指标函数的最优值称为最优值函数。 下面的方程在动态规划逆序求解中起着本质的作用。 称此为动态规划逆序求解的基本方程(贝尔曼方程)。 可以把建立动态规划模型归纳成以下几个步骤: (1)将问题恰当地划分为若干个阶段; (2)正确选择状态变量,使它既能描述过程的演变,又满足无后效性; (3)规定决策变量,确定每个阶段的允许决策集合; (4)写出状态转移方程; (5)确定各阶段各种决策的阶段指标,列出计算各阶段最优后部策略指标的基本方程。 下面结合具体例子阐述建立动态规划模型的思路。 例13 生产计划问题。公司要对某产品制定周的生产计划,产品每周的需求量、生产和贮存费用、生产能力的限制、初始库存量等都是已知的,试在满足需求的条件下,确定每周的生产量,使周的总费用最少。 决策变量是第周的生产量,记作。已知下列数据及函数关系:第周的需求量:第周产量为时的生产费为;第周初贮存量为时这一周的贮存费为;第周的生产能力限制为;初始()及终结()时贮存量均为零。按照最短路问题的思路,设从第周初贮存量为到(周末)过程结束的最小费用函数为,则下列逆向递推公式成立。 (1) 而与满足 (2) 这里贮存量是状态变量,(2)式给出了相邻阶段的状态在决策变量作用下的转移规律,称为状态转移规律。在用(1)式计算时,的取值范围——允许状态集合由(2)式及允许决策集合决定。 在实际问题中,为简单起见,生产费用常取,;,,其中是单位产品生产费,而是生产准备费。贮存费用常取,是单位产品(一周的)贮存费。 最优方程(1)和状态转移方程(2)构成了这个多阶段决策问题的动态规划模型。实际上,多阶段决策问题有时也可用静态规划方法求解,如例2的生产计划问题。 例14 资源分配问题。总量为的资源A和总量为的资源B同时分配给个用户,已知第用户利用数量的资源A和数量的资源B时,产生的效益为,问如何分配现有资源使总效益最大。 这本来是个典型的静态规划问题: (1)
您可能关注的文档
- 市政道路-园林绿化-施工组织设计.doc
- 试论现代企业中激励理论及运用.doc
- 试论余华《活着》的中福贵形象.doc
- 试述市场的含义和要素之间的关系.doc
- 试桩检测方案设计.doc
- 室内空气中甲醛的取样及测定—AHMT分光光度法.doc
- 室内卫生间改造工程方案设计.doc
- 室外采暖管线改造安装-施工方案设计.doc
- 手把手教你简笔画人物人物简笔画.大全.doc
- 手绘pop-教案.doc
- 渤海汽车2025年第三季度报告.pdf
- 【生物】湖南省部分学校2025-2026学年高三上学期9月联考(学生版).pdf
- 第五章 一元一次方程(单元解读课件)数学人教版2024七年级上册.pdf
- 【生物】湖南省部分学校2025-2026学年高三上学期9月联考(解析版).pdf
- 【生物】湖北省部分高中协作体2025-2026学年高二上学期9月联考(学生版) .pdf
- 华斯股份:2025年三季度报告.pdf
- 安徽省蚌埠市蚌埠第二中学2025-2026学年高二(上)开学检测物理试卷.pdf
- 安徽省六安市裕安区2024-2025学年高二生物上学期12月月考(解析版).pdf
- 安徽省皖南八校2024-2025年高二生物上学期期中考试(解析版).pdf
- 第五章 一元一次方程(复习课件)数学人教版2024七年级上册.pdf
最近下载
- 鲁教版九年级上册化学第1-6单元共5套单元测试卷汇编(含答案解析).pdf VIP
- 2025年上海市宝山区中考英语二模试卷(含详细答案解析).docx
- 4.1中国的机遇与挑战 课件.pptx VIP
- 应用文类型10:征文(投稿).pptx VIP
- 10SMS202-2 埋地矩形雨水管道及其附属构筑物(砖、石砌体).pdf VIP
- 2024年江苏城市职业学院单招职业技能测试题库及答案1套.docx VIP
- 东方绿洲介绍.ppt VIP
- GB50210-2018 建筑装饰装修工程质量验收标准.doc VIP
- 煤矿铁路专用线项目环评环境影响报告表(新版环评).pdf VIP
- 适用于风力发电风机基础大体积混凝土冬季施工方案范例.doc VIP
有哪些信誉好的足球投注网站
文档评论(0)