下载此文档

3连续时间动态最优化问题.docx


文档分类:论文 | 页数:约17页 举报非法文档有奖
1/17
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/17 下载此文档
文档列表 文档介绍
第三讲 连续时间动态最优化问题
一、预备知识
动态最优化问题历来是数学家们关注的热点和难点问题。从 17 世纪末的伯努利,到 20世纪50年代的贝尔曼和庞特里亚金,中间经 过拉格朗日、欧拉等一大批数学家的努力,才使动态最优化理论日臻 完一种是将泛函积分表
示,如(2)和(3)的表示的最优化问题,目标函数是路径及其导数 的函数。另一种表示,如(1)和(4)所示,目标函数是控制变量和 状态变量的函数,目标函数受转移动态方程的约束。
三、变分法
3.1 变分问题的一般形式
前面所述的最优化问题可以用目标泛函来表示:
max V【y]=j TF It, y(t), y '(t )lft ⑸
y0
且满足初始条件:
y (0) = A, y (T) = z
目标函数V[y]是路径y(t)的函数。我们的目的是选择一条路径使 积分表达式(5)达到最大。由于变分法是利用微积分的工具发展而 来,泛函极值问题是函数极值问题的发展和推广,所以,我们要求被 积函数具有一阶、二阶导数。我们知道,使函数达到最大值的点是极 值点,所以,使泛函达到极值的曲线或者路径为极值曲线或极值路径。
3.2 预备知识
对含参变量X积分:
I(x) = f b F (t, x)dt I
a
dI = I'(x) = f bF '(t, x)dt
dx a x
如果a, b也看作是参变量,则
I (a, b) = f bF (t, x)dt
a
哲=F (b, x) db
dI 耐 、
da
分步积分公式:
J vdu = vu -f udv
复合函数求导法:
对于 F lx(t), y (t), z (t)],有
dF QF dx dF dy 6F dz
= + +——
dt Qx Qt Qy dt Qz dt
由于函数FL, y(t), y,(t)]是(t, y, y,)的函数,而y, y,都是t的函数,所
以,F和F嘟是t的复合函数。因此,我们有
dF QF QF dy QF dy ,
y- = y- + y- + y-
dt Qt Qy dt Qy , dt
3.3.欧拉方程的推导
第一步,将求极值曲线的问题变换为求极值点的问题。假设 y*(t) 是已知的极值曲线,我们的目的是找到这条曲线所满足的必要条件。 任意选取连接(0, A)和(0, Z)点的扰动曲线p(t),则可以构造极 值曲线的邻近路径:
y(t) = y*(t)+e - p(t)
y,(t) = y*'(t) + e -p(t)
其中, s是一个任意小的数,当它趋于0时,y(t) T y*(t) 对于给定的y*(t)和p(t),每一个s对应于一条邻近路径y,从而确定 泛函的特定值。于是,泛函就成了 s的函数V = V(s ),其表达式为:
V(s) = J tfL y*(t) + s - p(t), y*'(t) + s - p'(t) Jt
0
在E =0点达到
由于极值曲线y *(t)对应点E =0,所以,函数V二V(£ )
最大值,根据一元函数极值的必要条件,必有:
dt
dV 兰力=Jt (竺空+竺空' dE 0 dE 0 [ Qy Qe dy' dE 丿
QFP(t) + QF
p'(t) dt =
丿
或者
p (t 劝+p '(t)dt=o o Qy o Qy'
第二步:进行分步积分
根据分步积分法,上式的第二个积分可以简化为
-jTp(t) 1 竺dt
o dt Qy'
n QF p '(t)dt=n 兽 dp(t)=兽 p(t)
0 Qy 0 Qy Qy
= -\T p (t)
0
d QF dt Qy'
dt
代入()式,可得:
d QF dt Qy'
p(t )dt = 0 丿
第三步:求欧拉方程
上式包含附加任意函数 p(t,) 泛函积分达到最优的条件应该不
依赖于附加函数p(t),事实上,我们可以证明
QF d QF .
— =0 •
Qy dt Qy '
为证明上述结论,我们证明下面的引理 如果给定函数f (t)和任意函数g (t)满足:
f T
0
d dF dt dy'
p(t )dt 二 0 丿
fTf(t)g(t)dt =0,贝泌有f(t)=0.
0
证明(反证法):如果f (t)丰0 ,
不失一般性,我们假设存在一
点t。使f (t0)〉0,由于f (t)是连续函数,所以必然存在一个充分小的数
5使f (t)在区间(t°-8, t°+6 )上,满足f (t)〉0。下面我们构造函数:
g(t)= 1, 当t g (t -5,t +5)
00
g(t)= 0,当t 电

3连续时间动态最优化问题 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数17
  • 收藏数0 收藏
  • 顶次数0
  • 上传人niupai21
  • 文件大小57 KB
  • 时间2022-05-20