首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
本文的目的是建立一个一般集上的动态规划模型,并给出它的存在性的证明,随着抽象分析的进展,抽象状态空间的动态规划不断有人涉及(例如[1]—[3]),本文的结果是在较弱的条件下给出的,本文使用的术语与未给证明的结果均来自[4]。  相似文献   

2.
在文献[1]—[3]中在各自的条件下,讨论过非时齐折扣马氏决策模型及其ε(≥0)最优策略存在的条件.在文献[4],文献[5]中,在状态和行动集都是可数的条件下,讨论了具有绝对平均相对有界的无界报酬的时齐折扣马氏决策模型.本文在状态集仍为可数,行动集为任意的条件下,建立与[4]相应的非时齐的折扣马氏决策模型;给出模型的有限阶段逼近和建立最优方程;证明了ε(>0)最优马氏策略的存在性和行动集为有限集时最优  相似文献   

3.
聂荣 《运筹与管理》2006,15(4):130-133
本文借助于广告方程所揭示出的商品销量与广告费用之间的动态规律;再利用分布参数系统建模研究企业供给的动态分布状态;在以广告支出作为控制变量的前提下,探讨了为使商品销售利润最大化,在产品的不同生命周期所应该采取的最优广告策略问题,并给出了某一时刻的商品需求量的预测方程。本文可为商家制定最优广告策略提供科学的参考依据。  相似文献   

4.
一个两人零和扩展反馈对策Γ由文[1]中的定义11给出。文[2]讨论了Γ的开环鞍点解与反馈鞍点解之间的关系。本文将讨论一般鞍点解与反馈鞍点解之间的关系。假定Γ是N级对策,P_1为第一行动者,P_2为第二行动者。并设u~i,Γ~i,i=1,2,分别为P_i的控制变量与策略空间。支付函数为J(r~1;r~2),P_1要极小化J,而P_2要极大化J。规定Γ的第k级的节点用变量x_k表示(1≤k≤N),x_1为初始点(即树的顶点)。再规定:对任意的策略对,它对应的实际玩法(即它对应的开环策略)所经过的节点集合称为由它产生的状态,用(X_(1r),x_(2r),…,x_(Nr))表示。本文涉及到的策略均指纯策略。首先给出一个简明的引理。  相似文献   

5.
本文考察了储备需求所增加的铸币收益在货币内生增长模型中的增长效应 .假设政府把铸币收益用在教育和公共生产性开支且对私人厂商有正的外部性 .用两部门内生增长模型分析因储备需求带来的增长效用 ,该经济有唯一的均衡增长路径 ,政府开支存在最优配置 ,且通过数据模拟存在最优储备率 .同样也得了与 [1 ]相类似的结论 :储备率与经济增长率的Laffer曲线关系 .  相似文献   

6.
本文给出一类线性规划的分析解法。它同单纯形法[1]或直除法[2]相比,具有如下优点:1.不需要进行“调整”,就能直接得最优解或判定规划无解,因而计算简单。2.在得出最优解的同时就能给出全部最优解(即所有的最小值点)。  相似文献   

7.
文献[1]中给出了拓扑空间的一种新的紧性,即 D-紧性,这里 D 是自然数集合 N 上的超滤。这种紧性介于可数紧性与紧性之间,且确实不同于这两者。[1]中证明了 D-紧性在拓扑空间的乘积运算下是保持的,即推广了紧空间的乘积的 Tychonoff 定理。文献[2]又成功地将这种紧性概念扩张至 D 是任意定向集上的超滤的情形,并利用紧度的概念对 D-紧性、紧性及其它们之间的关系作了深入研究。[2]中证明了:拓扑空间是紧的当且仅当它的紧度是∞(无穷大)。又证得了:乘积空间的紧度等于各个因子空间的紧度之最小者。这是[2]的主要结果,它进一步推广了 Tychonoff 定理。本文则是在文献[1]与[2]的基础上的进一步发展。作者利用 D-闭映射给出了 D-紧性的一个等价条  相似文献   

8.
本文用线性规划方法研究平均马氏决策过程,推广了K.W.Ross在[4]中得出的结果,给出列紧空间中可列状态可列行动多重约束马氏决策过程最优随机平稳策略的存在性。  相似文献   

9.
Wonham 与 Morse 在[1]中讨论了受外干扰作用的线性定常控制系统,在状态反馈下使输出不受干扰影响的干扰解耦问题(即 DDP),并由此开创了线性控制系统理论中的几何方法。我们在[3—6]中,用另外的方法讨论并解决了同一问题,即用状态反馈实现系统的能抗干性。在[6]中,我们提出了不受状态反馈影响的绝对能观子系统的概念。利用这一概念,我们还成功地把它推广到广义状态空间系统的同一类问题中。Willems 与 Commanlt 等在[8]、[9]中考虑了用量测输出的动态补偿器,来实现被调输出对系统外干扰的干扰解耦。  相似文献   

10.
可数状态MDP的平均模型   总被引:1,自引:0,他引:1  
本文考虑可数状态空间任意行动空间MDP的平均模型,分析了四个平均报酬准则,在通常的遍历性条件下,用鞅论的方法证明了其最优报酬值的一致性和最优策略的存在性,从而较好地解决了Feinberg和Park[1]再次提及的Open问题.通过导入相应于Feinberg和Park[1]的非循环条件,用概率分析的方法证明了一致最优(f,B)-生成策略的存在性,推广了Feinberg和Park(1994)的主要结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号