首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 31 毫秒
1.
连续型凸动态规划的离散近似迭代法研究   总被引:1,自引:0,他引:1  
为解决连续型凸动态规划的“维数灾”问题,提出了一种新的算法—离散近似迭代法.该算法的基本思路为:首先,将连续型状态变量离散化,根据网络图的构造方法将动态规划问题转化为多阶段有向赋权图;其次,运用极大代数求出起点至终点的最短路,即获得模型的一个可行解;最后,以该可行解为基础,继续迭代直到前后两个可行解非常接近.文章还证明了该算法的收敛性和线性收敛,并以一个具体例子验证了算法的有效性.  相似文献   

2.
背包问题的两阶段动态规划算法   总被引:1,自引:0,他引:1  
本文通过理论分析给出了背包问题的两阶段动态规划算法,用例题说明了其求解过程。在计算机上运用本文所述算法和背包问题的动态规划算法求解了大量例题。解题实践说明,对于大中型背包问题,两阶段动态规划算法由于只要求对少量变量进行排序而使解题时间大为缩短,是一种值得推荐的算法。  相似文献   

3.
一类最优指派问题的动态规划算法   总被引:4,自引:0,他引:4  
考虑一类指派问题:欲把m项工作指派n个人去完成(m≥n)。要求每项工作只能由一个人来做,第i个人可以同时做bi项工作,其中bi(bi≥1)是待求的未知数;i=1,2,…,n,满足∑^ni=1bi=m,假定已知第i人做第j项工作所用的时间cij≥0,i=1,2,…,m。中给出了求解上述问题最优指派(即使总耗用时间最小)的动态规划解法。  相似文献   

4.
连续型动态规划在投资决策中的应用   总被引:1,自引:0,他引:1  
储锦林 《大学数学》2003,19(5):101-104
首先简要介绍了动态规划方法及在投资决策中的应用.然后给出一个具体示例进行分析和计算.  相似文献   

5.
将动态风险度量方法运用到多阶段投资组合中,提出了具有交易成本和交易量限制的均值—动态VaR多阶段投资组合模型,并运用自创算法——离散近似迭代法求解.方法的基本思路为:首先,将模型中的连续型状态变量离散化,并将上述模型转化多阶段赋权有向图,然后,运用极大代数求出起点至终点的最长路程,即获得模型的一个可行解;最后,以该可行解为基础,继续迭代直到前后两个可行解非常接近.证明了该方法的收敛性,并以一个具体的算例,验证了该算法可以较快地计算出不同终期财富所对应的最优投资策略.  相似文献   

6.
针对不确定的非线性连续系统,通过神经网络对系统进行辨识.基于辨识后的确定系统,利用执行网-评价网双网结构进行同步调节解决最优跟踪问题.应用李雅谱诺夫方法进行辨识分析和系统稳定性分析,定理结论表明辨识系统为渐近辨识的,同时系统的跟踪误差和权重误差一致最终有界,倒立摆仿真例子验证了算法的有效性.  相似文献   

7.
An approach about large dynamic programming based on discrete linear system with a quadratic index function is proposed by importing two Lagrange multipliers.  相似文献   

8.
徐庆娟  简金宝 《数学杂志》2014,34(6):1155-1162
本文研究了求解半无限规划离散化问题(P)的一个新的算法.利用序列二次规划(SQP)两阶段方法和约束指标集的修正技术,提出了求解(P)的一个两阶段SQP算法.算法结构简单,搜索方向的计算成本较低.在适当的条件下,证明了算法具有全局收敛性.数值试验结果表明算法是有效的.推广了文献[4]中求解(P)的算法.  相似文献   

9.
为了基于动态规划法设计求约束最优化问题(COPs)最优解的迭代算法,在避免使用"标记函数"和递归算法的前提下提出了两种求解模式,给出了设计求COPs最优解的迭代算法一般方法,并利用两个典型优化问题-最长公共子序列问题和矩阵链乘法问题,阐明了如何利用两种求解模式设计求COPs最优解的简捷迭代算法.  相似文献   

10.
文[9,10]设计了直接求整数规划问题近似解的填充函数算法,但其所利用的文[2,3]的填充函数均带有参数,需要在算法过程中逐步调节。本文建立整数规划的广义填充函数的定义,说明了文[9,10]所利用的填充函数是整数规划问题的广义填充函数,并构造了一类不带参数的广义填充函数。进而本文设计了整数规划的一类不带参数的广义填充函数算法,数值试验表明算法是有效的。  相似文献   

11.
离散型确定性的动态规划问题,是运筹学规划论中一个重要的组成部分,其内容包含的问题比较多.求其最优解的方法,叫逆序法(又叫回推法).本提出一种统一的解法——图解法.其优点是:方便简便,计算简单.  相似文献   

12.
基于离散近似迭代法的多阶段M-V投资组合优化   总被引:2,自引:0,他引:2  
提出了离散近似迭代方法,并用该方法求解具有交易成本和交易量限制的多阶段均值-方差(M-V)投资组合模型.离散近似迭代方法的基本思路为:首先,将连续型状态变量离散化,根据网络图的构造方法将上述模型转化多阶段赋权有向图;其次,运用嘉量原理求出起点至终点的最长路程,即获得模型的一个可行解;最后,以该可行解为基础,继续迭代直到前后两个可行解非常接近.还证明了该方法的收敛性和复杂性.  相似文献   

13.
In this paper, a new kind of iteration technique for solving nonlinear ordinary differential equations is described and used to give approximate periodic solutions for some well-known nonlinear problems. The most interesting features of the proposed methods are its extreme simplicity and concise forms of iteration formula for a wide range of nonlinear problems.  相似文献   

14.
提出了求解线性规划(LP)问题的一种新方法———筛选迭代算法。它通过筛选n维LP问题的n个控制约束方程(不添加松驰变量)的方法求得LP问题的最优解  相似文献   

15.
多阶段M-SV投资组合优化的离散近似迭代法研究   总被引:2,自引:0,他引:2  
文章提出了离散近似迭代法,用该方法求解具有交易成本和交易量限制的多阶段均值一半方差(M-sV)投资组合模型.离散近似迭代方法的基本思路为:首先,将连续型状态变量离散化,根据网络图的构造方法将上述模型转化多阶段赋权有向图;其次,运用嘉量原理求出起点至终点的最长路程,即获得模型的一个可行解;最后,以该可行解为基础,继续迭代直到前后两个可行解非常接近.文章还证明了该方法的收敛性和复杂性.  相似文献   

16.
17.
Fundamental dynamic programming recursive equations are extended to the multicriteria framework. In particular, a more detailed procedure for a general recursive solution scheme for the multicriteria discrete mathematical programming problem is developed. Definitions of lower and upper bounds are offered for the multicriteria case and are incorporated into the recursive equations to aid problem solution by eliminating inefficient subpolicies. Computational results are reported for a set of 0–1 integer linear programming problems.This research was supported in part by CONACYT (Consejo Nacional de Ciencia y Technologia), Mexico City, Mexico.  相似文献   

18.
Approximate value iteration is a simple algorithm that combats the curse of dimensionality in dynamic programs by approximating iterates of the classical value iteration algorithm in a spirit reminiscent of statistical regression. Each iteration of this algorithm can be viewed as an application of a modified dynamic programming operator to the current iterate. The hope is that the iterates converge to a fixed point of this operator, which will then serve as a useful approximation of the optimal value function. In this paper, we show that, in general, the modified dynamic programming operator need not possess a fixed point; therefore, approximate value iteration should not be expected to converge. We then propose a variant of approximate value iteration for which the associated operator is guaranteed to possess at least one fixed point. This variant is motivated by studies of temporal-difference (TD) learning, and existence of fixed points implies here existence of stationary points for the ordinary differential equation approximated by a version of TD that incorporates exploration.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号