首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   10篇
  免费   0篇
  国内免费   7篇
数学   11篇
综合类   6篇
  2003年   1篇
  1998年   2篇
  1996年   1篇
  1994年   1篇
  1993年   1篇
  1992年   4篇
  1991年   1篇
  1985年   2篇
  1984年   1篇
  1983年   3篇
排序方式: 共有17条查询结果,搜索用时 15 毫秒
1.
林元烈 《数学学报》1992,35(1):8-19
本文是首次在转移率矩阵族为一般 Q 矩阵族(未必保守亦未必一致有界)的条件下,研究状态空间与决策集均为可数集的连续时间折扣矩最优模型(M_k-CTMDP);提出离散时间折扣依赖于状态与决策的拟折扣矩最优模型(β_k-GTMDP);并揭示二者之间的关系;给出在 f~∞下折扣总报酬 k 阶矩向量 μ_k(f)满足:kαμ_k(f)=kr(f)(?)μ_(k-1)(f)+Q(f)μ_k(f)及μ_k(f)=kP~(min)(kα,f)(r(f)(?)μ_(k-1)(f))的简洁表达式;给出报酬矩最优是矩最优方程组唯一有界解的一个很弱的充分条件与解法;给出矩最优策略存在的充要条件与若干性质.本文结果对 MDP 理论的发展与应用有重要意义,而且对跳跃型马氏过程的一类积分型泛函的研究与应用也颇有意义.  相似文献   
2.
在水电站水库优化调度中,常用马氏决策规划寻求使平均年期望发电量达到最大的最优策略。但是这种策略往往不能满足所谓保证率的要求。本文对带有报酬的完全各态历经的马氏链,根据工程上使用的频率形式保证率的定义,给出它的概率形式的定义。从而把问题归结为一种随机性约束下的马氏决策规划。对于用罚因子法求解这一问题进行了研究,证明该方法的一些在实用上有价值的性质。最后推广到水库优化调度所需要的周期性的情况。  相似文献   
3.
本文对平稳无后效流的特性作了进一步的探讨,给出了几个新的且易于验证的充要条件.并将所得的结果用于求一些排队系统,在统计平衡下顾客的实等待时间分布.  相似文献   
4.
研究了连续时间首达时间及首达目标总报酬(非折扣)的L最优模型。给出新的k阶矩简洁表示式;证明L最优模型可化为离散时间拟折扣期望报酬优化模型;给出L最优与M最优之间的关系与若干性质。  相似文献   
5.
1.引言 连续时间首达目标模型有广泛的实际背景,它可应用于可靠性系统的优化问题,排队系统的优化控制问题,自动控制中的决策优化问题,等等。我们准备研究下列几个模型: Ⅰ,折扣矩最优模型; Ⅱ,考虑工作寿命的最优模型; Ⅲ,首达时间依分布最优模型。  相似文献   
6.
纯跳跃马氏链切截后有关随机变量的矩及其性质   总被引:1,自引:1,他引:0  
林元烈 《数学学报》1985,28(6):825-842
本文研究了纯跳跃马氏链切截后的几个问题: 1.给出了A_i(t),A_(im)(t),M_i(t)和M_(im)(t)的一类表达式和所满足的积分方程组,以及当t→∞时A_i(t),M_i(t) 的极限性质。 2.得到了A_i(t),A_(im)(t),M_i(t)和F_i(t,x)的拉氏变换所满足的方程组,以及它们解的存在唯一的充分条件。 3.给出了求Ai(t),A_(im)(t)和F_i(t,x) 的构造性定理所述结果对应用于实际问题是有益的,例如在某些更新维修问题中。  相似文献   
7.
马氏链首达时间反问题中矩的估计及其性能分析   总被引:1,自引:0,他引:1  
提出了马氏链的反向问题中,在独立加性高斯有色随机噪声背景下,估计Markov链首达时间各阶矩的统计方法。利用累积量的性质,得出了带噪样本的k阶矩仅与噪声的方差有关,而与噪声的其它任意阶矩无关,并证明了用该方法得到的估计值具有无偏性和强相合性的统计性能。通过一个数值例子仿真了连续时间参数Markov链模型的构造过程,得到的首达时间各阶矩的估计值及其分布函数的L-S变换比去噪处理前更接近无噪声情况,在理论和实验两方面验证了该方法的有效性。  相似文献   
8.
Decision makers often face the need of performance guarantee with some sufficiently high probability. Such problems can be modelled using a discrete time Markov decision process (MDP) with a probability criterion for the first achieving target value. The objective is to find a policy that maximizes the probability of the total discounted reward exceeding a target value in the preceding stages. We show that our formulation cannot be described by former models with standard criteria. We provide the properties of the objective functions, optimal value functions and optimal policies. An algorithm for computing the optimal policies for the finite horizon case is given. In this stochastic stopping model, we prove that there exists an optimal deterministic and stationary policy and the optimality equation has a unique solution. Using perturbation analysis, we approximate general models and prove the existence of e-optimal policy for finite state space. We give an example for the reliability of the satellite sy  相似文献   
9.
在Gelenbe随机神经网络(GNN)模型基础上,提出扩展GNN(EGNN)模型。考虑信号释放强度依赖于神经元兴奋水平的情形,给出了EGNN的平稳分布。讨论了平稳分布存在的条件。在较弱假设下,EGNN仍具有简洁的“积”形式平稳分布,比原GNN增强了调节平稳分布概率结构特性的功能,且能够表达更多的智能和生物特性。例举了它的联想功能。  相似文献   
10.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号