首页 | 本学科首页   官方微博 | 高级检索  
     

带有讨厌参数的multi-armed bandit问题
作者姓名:孙嘉阳
作者单位:北京大学数学系
摘    要:这篇文章讨论了带有讨厌参数的multi-armed bandit问题。给出了关于该问题的所有ISS法则(不变的序贯抽样法则)之“遗憾”的渐近下界;找出了渐近最优的法则,即使“遗憾”达到上述下界的法则;并给出了构造渐近最优法则中要求的点估计和置信序列的一般性方法。还着重考虑了讨厌参数为刻度参数的情形。最后用一些技巧对几个常见的总体进行了具体计算。

点击此处可从《中国科学A辑》浏览原始摘要信息
点击此处可从《中国科学A辑》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号