下载此文档

10动态规划1.ppt


文档分类:建筑/环境 | 页数:约43页 举报非法文档有奖
1/43
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/43 下载此文档
文档列表 文档介绍
动态规划( Dynamic Programming ) 动态规划是美国数学家 Bellman 创立的。是解决复杂系统优化问题的一种方法。是解决动态系统多阶段决策过程的基本方法之一。 R Bellman50 年代执教于普林斯顿和斯坦福大学,后进入兰德( Rand ) 研究所。 1957 年发表“ Dynamic Programming ”一书,标志动态规划的正式诞生。动态系统:包含随时间变化的因素和变量的系统。包含:线性系统、非线性系统。动态系统的特点:系统在某个时刻的状态,往往要依某种形式受过去某些决策的影响,而系统的当前状态和决策又会影响系统过程今后的发展。动态决策问题:将时间作为决策变量之一的决策问题称为动态决策问题。动态决策问题的特点:在动态决策问题中,系统所处的状态和时刻是进行决策的重要因素,即在系统发展的不同时刻(或阶段)根据系统所处的状态,不断地做出决策,找到不同时刻的的最优决策以及整个过程的最优策略。第一节:动态规划的研究对象和引例多阶段决策问题:是动态决策问题的一种特殊形式。在多阶段决策过程中, 系统的动态过程可以按照时间进程分为状态相互联系而又相互区别的各个阶段,而且在每个阶段都要进行决策。目的是使整个过程的决策达到最优效果。多阶段决策问题的典型例子: 1、生产决策问题:企业在生产过程中,由于需求是随时间变化的,因此企业为了获得全年的最佳生产效益,就要在整个生产过程中逐月或逐季度地根据库存和需求决定生产计划。 12 n ?状态决策状态决策状态状态决策在低负荷下生产时,产品的年产量 h和投入生产的机器数量 u 2的关系为 h=h(u 2) 相应的机器年完好率 b, 0< b<1 。假定开始生产时完好的机器数量为 s 1。要求制定一个五年计划,在每年开始时,决定如何重新分配完好的机器在两种不同的负荷下生产的数量, 使在五年内产品的总产量达到最高。 2、机器负荷分配问题:某种机器可以在高低两种不同负荷下进行生产。在高负荷下进行生产时,产品的年产量 g和投入生产的机器数量 u 1的关系为 g=g(u 1) 这时,机器的年完好率为 a, 即如果年初完好机器的数量为 u, 到年终完好的机器数量就为 a, 0<a<1 。 3、航天飞机飞行控制问题:由于航天飞机的运动环境是不断变化的, 因此要根据航天飞机在不同环境中的飞行情况,不断地决定航天飞机的飞行方向(姿态)和速度,使之能最省燃料和实现目的(如软着落问题)。 4、静态问题不包含时间因素的静态决策问题(本质上是一次决策问题)也可以适当地引入阶段的概念,作为多阶段的决策问题用动态规划方法来解决。静态规划问题也可以通过适当地引入阶段的概念,应用动态规划方法加以解决,后面将详细介绍。 5、最短路径问题:给定一个交通网络图如下,其中两点之间的数字表示距离(或花费),试求从 A点到 G点的最短距离(总费用最小)。 A B1 B2 C1 C2 C3 C4 D1 D2 D3 E1 E2 E3 F1 F2 G 53 136876 68353384 221233 355266 43 123456 1 阶段、阶段变量:把所给问题的过程,适当地分为若干个相互联系的阶段,目的是能按一定的次序去求解。描述阶段的变量称为阶段变量,常用 k表示。阶段的划分,一般是按照时间和空间的自然特征划分,原则是便于把问题过程能转化为多阶段决策过程。 2 状态、状态变量:状态表示每个阶段开始所处的自然状态或客观条件, 通常一个阶段有若干个状态。描述过程状态的变量称为状态变量。可用一个数、一组数或一向量来描述, 常用 s k 标记第 k 阶段的状态。一般来说,状态变量的取值有一定的允许集合或范围,此集合称为状态允许集合。第二节: 动态规划的基本概念和定义 3 决策、决策变量:当过程处于某一阶段的某个状态时,可以做出不同的决定(或选择),从而决定下一阶段的状态,这种决定称为决策。在最优控制中也称为控制。描述决策的变量,称为决策变量。它可以用一个数、一组数或一个向量来描述。它是状态变量的函数,常用 u k (s k ) 表示第 k阶段当状态为 s k时的决策变量。在实际问题中决策变量的取值往往在某一范围之内,此范围称为允许决策集合。常用 D k (s k)表示第 k阶段从状态 s k 出发的允许决策集合,显然有 u k (s k ) ?D k (s k)。 4 多阶段决策过程:即可在各个阶段进行决策,控制过程发展的多段过程。多阶段决策过程的发展是通过一系列的状态转移来实现的, 一般来说,系统在某一阶段的状态转移不但与系统的当前(或本阶段) 状态和决策有关,而且还于系统历史状态和过去的决策有关。其状态转移方程如下(一般形式) ),,,,,,( ),,,( ),( 22111 221123 1112kk kkusus

10动态规划1 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数43
  • 收藏数0 收藏
  • 顶次数0
  • 上传人luyinyzhi
  • 文件大小497 KB
  • 时间2017-02-18