问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

动态规划的基本概念

发布网友 发布时间:2022-03-24 06:02

我来回答

1个回答

热心网友 时间:2022-03-24 07:32

1.阶段

阶段是指研究的事物在发展过程中所处的时段或地段。处理多阶段决策问题,需要将全过程划分若干阶段,每个阶段进行一次抉择。若演变过程是离散的,则用序列编号i=1,2,…,n表示,称为阶段变量。它可以是空间,也可以是时间。若为时间,则按相等增量Δt离散,或按连续变化,以变量t表示。

2.状态

在多阶段决策过程中,各阶段演变可能发生的情况,称为状态。描述状态的变量称为状态变量。一个阶段可能有若干个状态。若第i阶段有m个状态变量,可用si表示该阶段的状态集合:

华北煤田排水供水环保结合优化管理

3.决策

决策是某阶段状态给定之后,从该状态演变到下一阶段某状态的选择。当阶段的初始状态给定后,做出某一决策,则本阶段的初始状态就变成该阶段的末状态,做出不同的决策,就得出不同的末状态。描述决策变化的量,称为决策变量。常用di(si)表示第i阶段状态处于si时的决策。在实际问题中,决策变量的取值往往被*在某一范围之内,此范围称为允许决策集合或决策空间,常用di(si)∈Di(si)表示。

4.策略

策略是指一个决策序列。由第1阶段开始至终点为止的过程,称为问题的全过程;由每个阶段的决策di(si)(i=1,2,…,n)所组成的决策序列,称为全过程策略,简称策略,记为P1n

华北煤田排水供水环保结合优化管理

从k阶段开始至终点的过程,称为原问题的后子过程(或称k子过程),其决策序列称为k子过程策略,简称子策略,即

华北煤田排水供水环保结合优化管理

在实际问题中,可供选择的策略有一定范围,此范围称为允许策略集合,以P表示。从允许策略范围集合中,找出达到最优效果的策略,称为最优策略,最优策略相应的状态序列,称为最优轨迹。

5.状态转移方程

下一阶段状态Sk+1是本阶段状态变量Sk和决策变量Xk(Sk)的函数,即对于状态Sk的决策结果是Sk+1,记为

华北煤田排水供水环保结合优化管理

简写为

华北煤田排水供水环保结合优化管理

这种从某状态出发到下一阶段某状态的转移规律称为状态转移方程。

6.目标函数

在多阶段最优决策过程中,目标函数是用来衡量策略优劣的数量指标。

状态的转移就产生费用(效益)的改变,它们是同时发生的。设ri表示i阶段的费用(效益),则ri也是si及di的函数,可写为

华北煤田排水供水环保结合优化管理

此式称为第i阶段的费用(效益)方程。若从过程的第一阶段初始状态开始,经历全部阶段,可得到全过程的总费用R,即总费用R是各阶段费用ri的总和,表示为

华北煤田排水供水环保结合优化管理

因为状态和决策往往是一个向量,所以总费用R也是一个向量,其最优值的数量指标,就是过程的目标函数,常用R*表示,即

华北煤田排水供水环保结合优化管理

式中:Opt(optimization)表示最优值,可取极大或极小,依目标性质而定。

通过以上讨论,可将多阶段决策过程归纳为如图3-1所示。

图3-1 多阶段决策过程示意图

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
如何分别真金和仿金首饰 怎样区分真金和仿金首饰呢 小学生新年晚会主持人的串词!!(不要太多)急 大大后天就需要了!!!_百度... 周年晚会策划公司 奥格瑞玛传送门大厅在哪 奥格瑞玛传送门大厅怎么走 锻炼颈椎的几个动作 水多久能结冰 冰能在多长时间内形成 请问水低于0度会结冰吗? 如何防止脱发严重 嘴唇上有黑印用蜜蜡和棉线去除了胡须 动态规划的概念 动态规划和备忘录法的区别 动态规划原理(详细) 下面哪个不是动态规划的基本要素 动态规划 求动态规划的资料 算法分析与设计这门课程第三章动态规划的知识点有哪些? 什么是动态规划? 动态规划模型的构成要素有? 动态规划的基本要素 荣耀V20开不了机 自动关机的 按什么键都没有反应 手机电充足没root过? 荣耀的手机还能root吗? 我的荣耀V20丢了,现在已经切换成锁定模式!这样人家刷机能解开吗? 华为P30和荣耀V20还有小米9买哪个好。本人比较喜欢玩游戏。 荣耀20pro如何root 我的荣耀V20为什么不能刷机 荣耀20pro怎么root权限 荣耀20i可以root吗 荣耀20怎么root 荣耀V20root怎么获取 算法分析中动态规划的四个基本步骤 什么是动态规划?如何运用动态规划解决实际问题? 动态规划算法 通俗的讲解一下 动态规划的基本原理和递推方程 请总结或者综述一下动态规划的发展过程。 简述动态规划算法的基本范式 c++动态规划是什么? 动态规划法的原理 适合用动态规划方法求解的问题必须具备何种特征 手机怎么校准电池电量虚电 vivo虚电电池校正 苹果手机虚电量如何校正? oppo手机虚电怎么校正 荣耀手机虚电量校正 华为手机虚电量校正 oppo手机虚电量校正 黑鲨3手机虚电怎么校正 oppoa9手机出现虚电怎么校准? vivo手机电池虚电怎么解决 苹果手机虚电量校正