下载此文档

3连续时间动态最优化问题.docx

文档分类：论文 | 页数：约17页举报非法文档有奖

1/17

下载提示

1.该资料是网友上传的，本站提供全文预览，预览什么样，下载就什么样。
2.下载该文档所得收入归上传者、原创者。
3.下载的文档，不会出现我们的网址水印。

同意并开始全文预览

(约 1-6 秒)

1/17 下载此文档

文档列表 文档介绍

第三讲连续时间动态最优化问题
一、预备知识
动态最优化问题历来是数学家们关注的热点和难点问题。从 17 世纪末的伯努利，到 20世纪50年代的贝尔曼和庞特里亚金，中间经过拉格朗日、欧拉等一大批数学家的努力，才使动态最优化理论日臻完一种是将泛函积分表
示，如（2）和（3）的表示的最优化问题，目标函数是路径及其导数的函数。另一种表示，如（1）和（4）所示，目标函数是控制变量和状态变量的函数，目标函数受转移动态方程的约束。
三、变分法
3．1 变分问题的一般形式
前面所述的最优化问题可以用目标泛函来表示：
max V【y]=j TF It, y(t), y '(t )lft ⑸
y0
且满足初始条件：
y (0) = A, y (T) = z
目标函数V[y]是路径y(t)的函数。我们的目的是选择一条路径使积分表达式(5)达到最大。由于变分法是利用微积分的工具发展而来，泛函极值问题是函数极值问题的发展和推广，所以，我们要求被积函数具有一阶、二阶导数。我们知道，使函数达到最大值的点是极值点，所以，使泛函达到极值的曲线或者路径为极值曲线或极值路径。
3．2 预备知识
对含参变量X积分:
I(x) = f b F (t, x)dt I
a
dI = I'(x) = f bF '(t, x)dt
dx a x
如果a, b也看作是参变量，则
I (a, b) = f bF (t, x)dt
a
哲=F (b, x) db
dI 耐、
da
分步积分公式:
J vdu = vu -f udv
复合函数求导法：
对于 F lx(t), y (t), z (t)］，有
dF QF dx dF dy 6F dz
= + +——
dt Qx Qt Qy dt Qz dt
由于函数FL, y(t), y，(t)］是(t, y, y，)的函数，而y, y，都是t的函数，所
以，F和F嘟是t的复合函数。因此，我们有
dF QF QF dy QF dy ，
y- = y- + y- + y-
dt Qt Qy dt Qy ， dt
3．3．欧拉方程的推导
第一步，将求极值曲线的问题变换为求极值点的问题。假设 y*(t) 是已知的极值曲线，我们的目的是找到这条曲线所满足的必要条件。任意选取连接(0, A)和(0, Z)点的扰动曲线p(t),则可以构造极值曲线的邻近路径：
y(t) = y*(t)+e - p(t)
y，(t) = y*'(t) + e -p(t)
其中, s是一个任意小的数，当它趋于0时，y(t) T y*(t) 对于给定的y*(t)和p(t)，每一个s对应于一条邻近路径y,从而确定泛函的特定值。于是，泛函就成了 s的函数V = V(s )，其表达式为：
V(s) = J tfL y*(t) + s - p(t), y*'(t) + s - p'(t) Jt
0
在E =0点达到
由于极值曲线y *(t)对应点E =0，所以，函数V二V(£ )
最大值，根据一元函数极值的必要条件，必有：
dt
dV 兰力=Jt (竺空+竺空' dE 0 dE 0 [ Qy Qe dy' dE 丿
QFP(t) + QF
p'(t) dt =
丿
或者
p (t 劝+p '(t)dt=o o Qy o Qy'
第二步：进行分步积分
根据分步积分法，上式的第二个积分可以简化为
-jTp(t) 1 竺dt
o dt Qy'
n QF p '(t)dt=n 兽 dp(t)=兽 p(t)
0 Qy 0 Qy Qy
= -\T p (t)
0
d QF dt Qy'
dt
代入()式，可得：
d QF dt Qy'
p(t )dt = 0 丿
第三步：求欧拉方程
上式包含附加任意函数 p(t，) 泛函积分达到最优的条件应该不
依赖于附加函数p(t),事实上，我们可以证明
QF d QF .
— =0 •
Qy dt Qy '
为证明上述结论，我们证明下面的引理如果给定函数f (t)和任意函数g (t)满足：
f T
0
d dF dt dy'
p(t )dt 二 0 丿
fTf(t)g(t)dt =0,贝泌有f(t)=0.
0
证明(反证法)：如果f (t)丰0 ,
不失一般性，我们假设存在一
点t。使f (t0)〉0，由于f (t)是连续函数，所以必然存在一个充分小的数
5使f (t)在区间(t°-8, t°+6 )上，满足f (t)〉0。下面我们构造函数：
g(t)= 1，当t g (t -5,t +5)
00
g(t)= 0，当t 电

3连续时间动态最优化问题来自淘豆网www.taodocs.com转载请标明出处.