共查询到19条相似文献,搜索用时 140 毫秒
1.
张登兵 《数学的实践与认识》2011,41(10)
训练和学习是博弈中的一对统一体.博弈学习是通过降低博弈语境的不确定性来提高博弈收益,而博弈训练则是针对博弈学习的一种策略.训练者通过可信的信号传递来影响对手的博弈学习结果,改变受训者的信念,从而提高博弈收益.博弈训练的目标可分为事实隐藏和事实揭示.在使用博弈训练时,应遵循"利已、利他、可信、可辩"的原则,从全局的角度审视整个博弈环境,选择利己利他的训练方法,最终取得较优的训练效果. 相似文献
2.
首先,将经典合作博弈进行扩展,提出了一类模糊联盟合作博弈的通用形式,涵盖常见三种模糊联盟合作博弈,即多线性扩展博弈、比例模糊博弈与Choquet积分模糊博弈.比例模糊博弈、Choquet积分模糊博弈的Shapley值均可以作为一种特定形式下模糊联盟合作博弈的收益分配策略,但是对于多线性扩展博弈的Shapley值一直关注较少,因此利用经典Shapley值构造出多线性扩展博弈的Shapley值,以此作为一种收益分配策略.最后,通过实例分析了常见三类模糊联盟合作博弈的形式及其对应的分配策略,分析收益最大的模糊联盟合作对策形式及最优分配策略,为不确定情形下的合作问题提供了一定的收益分配依据. 相似文献
3.
首先把信息集的概念引入到多目标博弈, 建立了信息集广义多目标博弈模型, 并指出了信息集广义多目标博弈以广义多目标博弈、广义n人非合作博弈、一般n人非合作博弈为特例, 然后用Fan-Glicksberg不动点定理证明了信息集广义多目标博弈弱Pareto-Nash平衡点的存在性, 最后在本质解和强本质解的意义下,
分别研究了信息集广义多目标博弈弱Pareto-Nash平衡点的通有稳定性和强本质连通区的存在性. 相似文献
4.
《数学的实践与认识》2013,(14)
从博弈基本理论的完美性出发,对博弈要素进行系统规范化是一个重要的课题.博弃由博弃主体、博弈语境和信号三个基本要素,而信息、理性、信念和效用则是博弈主体的根本属性.这些要素共同决定博弈主体在博弈中的行为.博弃主体具有效用最大化的倾向,但效用的评价却具有多样性.主体的策略空间和效用函数具有客观性,但主体对它们的认识却具有主观性.博弈主体的根本任务就是要通过对博弈语境的学习,使主观认识和客观事实不断接近,理性不断改善,最终获取较优的博弈效用. 相似文献
5.
本文研究了一类连续博弈解的存在性及稳定性.利用BNN动力学理论和方法,将演化博弈论中的几个经典例子:鹰-鸽博弈、协调博弈和猜硬币博弈转化为连续型支付函数的连续博弈后,获得了鹰-鸽连续博弈的Nash平衡点是演化稳定和连续稳定的,推广了文献[8]中关于演化博弈Nash平衡点及稳定性结果. 相似文献
6.
分析了房地产销售的纳什博弈模型、房地产开发商作为领导者寡头博弈模型、房地产销售商作为领导者寡头博弈模型、房地产市场销售讨价还价博弈模型四种房地产市场销售博弈模型的利益分配机制和收益策略.结果表明,在房地产开发商作为领导者寡头博弈策略中,房地产销售商具有实施投机行为的动机,利益分配机制不稳定;在房地产销售商作为领导者寡头博弈策略中,房地产销售商没有实施投机行为的动机,利益分配机制的稳定;在房地产市场销售讨价还价博弈策略中,房地产销售商利益分配机制的稳定性与房地产产品的差异化替代率和无限期重复博弈策略的贴现率均有关. 相似文献
7.
8.
在合作博弈中,Shapley单点解按照参与者对联盟的边际贡献率对联盟的收益进行分配.联盟收益具有不确定性,往往不能用精确数值表示,更多学者关注特征函数取值为有限区间的合作博弈(区间合作博弈)的收益分配.文章利用矩阵半张量积,研究区间合作博弈中含有折扣因子的Shapley区间值的矩阵计算.首先利用矩阵的半张量积将合作博弈的特征函数表示为矩阵形式,得到特征函数区间矩阵.然后通过构造区间合作博弈Shapley矩阵,将区间合作博弈的Shapley值(区间)计算转化为矩阵形式.最后利用区间合作博弈Shapley值矩阵公式计算分析航空公司供应链联盟收益的Shapley值.文章给出的区间合作博弈Shapley值的矩阵计算公式形式简洁,为区间合作博弈的研究提供了新的思路. 相似文献
9.
《运筹学学报》2019,(4)
首先,将经典合作博弈进行扩展,提出了一类模糊联盟合作博弈的通用形式,涵盖常见三种模糊联盟合作博弈,即多线性扩展博弈、比例模糊博弈与Choquet积分模糊博弈.比例模糊博弈、Choquet积分模糊博弈的Shapley值均可以作为一种特定形式下模糊联盟合作博弈的收益分配策略,但是对于多线性扩展博弈的Shapley值一直关注较少,因此利用经典Shapley值构造出多线性扩展博弈的Shapley值,以此作为一种收益分配策略.最后,通过实例分析了常见三类模糊联盟合作博弈的形式及其对应的分配策略,分析收益最大的模糊联盟合作对策形式及最优分配策略,为不确定情形下的合作问题提供了一定的收益分配依据. 相似文献
10.
本文研究了非合作-合作双型博弈模型求解的问题.首先利用于α-CIS值,求解非合作-合作双型博弈中的合作博弈阶段,再对非合作博弈阶段求其纯策略纳什均衡,获得了基于α-CIS值的双型博弈的一种新的求解方法.推广了原始双型博弈模型的求解方法并证明其可行性. 相似文献
11.
Elżbieta Z. Ferenstein 《Mathematical Methods of Operations Research》2007,66(3):531-544
We study nonzero-sum stopping games with randomized stopping strategies. The existence of Nash equilibrium and ɛ-equilibrium
strategies are discussed under various assumptions on players random payoffs and utility functions dependent on the observed
discrete time Markov process. Then we will present a model of a market game in which randomized stopping times are involved.
The model is a mixture of a stochastic game and stopping game.
Research supported by grant PBZ-KBN-016/P03/99. 相似文献
12.
建立一个由两个制造商和一个零售商组成供应链模型,以求解制造商和零售商的最优定价决策,其中两个制造商向零售商批发的产品是不完美互补的,且零售商采取混合捆绑策略销售这两种产品。考虑三种情形下的决策:(1)完全非合作博弈;(2)局部合作博弈;(3)合作博弈。通过比较前两种情形下的决策,利用Nash协商模型求解得到消除水平和垂直供应链冲突的最优定价决策。与完全非合作博弈决策相比,局部合作博弈决策对制造商是有利的,在一定的条件下也可以实现对零售商收益的帕累托改进;而合作博弈决策在任何情况下都要明显地优于完全非合作博弈决策以及局部合作博弈决策,同时合作博弈决策下的最优产品需求量相比局部合作博弈决策下的最优产品需求量提高了一倍。最后,通过数值试验验证了文章所得结论。 相似文献
13.
索赔是工程项目各参与主体共同关注的焦点,索赔决策直接影响业主方和承包方的利益。研究通过分析工程索赔的特性,结合FIDIC合同条件下的索赔条款,提出索赔的博弈基础;分析博弈论和贝叶斯法则与索赔决策之间的契合程度,构建工程索赔的基本博弈模型;基于工程索赔的四种情境,构建完全信息有限多轮博弈模型、资金时间价值对博弈模型的影响、不完全信息有限多轮博弈模型和非完全对立的不完全信息有限多轮博弈模型并求解“纳什均衡”,模拟工程参与方做出索赔决策的路径,寻求相应情形下承包方和业主方的最优策略,提出工程参与方优化索赔策略的建议。 相似文献
14.
审计中博弈模型的扩展分析 总被引:6,自引:0,他引:6
进一步研究审计中的博弈分析.在更为一般的条件下分别建立了审计机关与被审计部门之间的完全信息静态博弈模型和无限阶段重复博弈模型,得到审计机关最优混合策略及其对弄虚作假罚款系数的公式,探讨了影响局中人行为的若干因素,提出了加强审计工作的几点建议. 相似文献
15.
本文首先建立了基于再保险人分担理赔费用的夸大风险损失的索赔欺诈博弈模型,然后分析了保险双方的博弈策略选择及其可能达到的均衡。研究表明,博弈模型存在某种形式的精炼贝叶斯纳什均衡,但如实告知一般不是保单持有人的精炼贝叶斯纳什均衡策略。而且,博弈模型不存在分离均衡,当费用自负率在一定范围内变化时,局中人将交替选用分离策略与合并策略。 相似文献
16.
《Applied Mathematical Modelling》2014,38(21-22):5269-5278
The development of a course of action (COA) is one of key steps in operation planning. Considering the conflict game, resource restriction, and the influence of execution time, this paper establishes a COA development model based on the timed influence net and game theory. The given problem is solved by transforming it into a standard matrix game model. An example is provided to illustrate this model and its solution. 相似文献
17.
18.
为发现团队规范下管制员违章行为及监管策略的演化博弈规律,运用演化博弈理论,构建安全管理者与管制员演化博弈模型,分析博弈系统均衡点的局部稳定性。在此基础上建立演化博弈的系统动力学模型,仿真模拟不同情形下博弈双方策略选择的动态演化过程,并分析模型参数变化对系统演化结果的影响。结果表明:正的团队规范有助于系统演化至理想模式,负的团队规范会使系统陷入“不良锁定”模式和“震荡”模式;管制员行为收益、行为成本、被监查到的概率、处罚力度、监管成本等因素均对系统演化结果产生影响。鼓励班组成员对违章行为进行否定性评价、加大对管制员的处罚力度等均能够长效促进管制员主动遵章。 相似文献
19.
结合DEA和博弈的思想研究二阶段网络系统的固定成本分摊问题,将分摊成本作为新的投入,可以证明存在某种分摊使DMU整体效率达到最优,在此基础上考虑各个DMU之间以及DMU内部之间的博弈,首先建立讨价还价乘积最大化模型,求出各DMU唯一的分摊解,然后建立DMU子系统之间的讨价还价模型,给出子系统的分摊解,最终的分摊方案满足系统效率和子系统效率为1,与现有的方法相比具有一定的优势. 相似文献