您当前的位置:
首页 >
文章列表页 >
基于优先级扫描Dyna结构的贝叶斯Q学习方法
学术论文
    • 基于优先级扫描Dyna结构的贝叶斯Q学习方法

    • Bayesian Q learning method with Dyna architecture and prioritized sweeping

    • 通信学报   2013年34卷第11期 页码:129-139
    • DOI:10.3969/j.issn.1000-436x.2013.11.015    

      中图分类号: TP181
    • 网络出版日期:2013-11

      纸质出版日期:2013-11-25

    移动端阅览

  • 于俊, 刘全, 傅启明, 等. 基于优先级扫描Dyna结构的贝叶斯Q学习方法[J]. 通信学报, 2013,34(11):129-139. DOI: 10.3969/j.issn.1000-436x.2013.11.015.

    Jun YU, Quan LIU, Qi-ming FU, et al. Bayesian Q learning method with Dyna architecture and prioritized sweeping[J]. Communication journal, 2013, 34(11): 129-139. DOI: 10.3969/j.issn.1000-436x.2013.11.015.

  •  
  •  

0

浏览量

0

下载量

4

CSCD

文章被引用时,请邮件提醒。
提交
工具集
下载
参考文献导出
分享
收藏
添加至我的专辑

相关文章

网络结构自调整的柔性内涵初探
基于软提示微调和强化学习的网络安全命名实体识别方法研究
基于审计博弈的安全协作频谱感知方案
基于强化学习的在线离线混部云环境下的调度框架
基于深度强化学习的微服务多维动态防御策略研究

相关作者

程东年
汪斌强
王保进
张建辉
田泽庶
刘春雨
张云婷
张嘉宇

相关机构

国家数字交换系统工程技术研究中心
哈尔滨工业大学计算学部
上海大学机电工程与自动化学院
西安交通大学网络空间安全学院
北京大学计算机学院
0