您当前的位置:
首页 >
文章列表页 >
增量式双自然策略梯度的行动者评论家算法
学术通信 | 更新时间:2024-06-05
    • 增量式双自然策略梯度的行动者评论家算法

    • Actor-critic algorithm with incremental dual natural policy gradient

    • 通信学报   2017年38卷第4期 页码:166-177
    • DOI:10.11959/j.issn.1000-436x.2017089    

      中图分类号: TP181
    • 网络出版日期:2017-04

      纸质出版日期:2017-04-25

    移动端阅览

  • 章鹏, 刘全, 钟珊, 等. 增量式双自然策略梯度的行动者评论家算法[J]. 通信学报, 2017,38(4):166-177. DOI: 10.11959/j.issn.1000-436x.2017089.

    Peng ZHANG, Quan LIU, Shan ZHONG, et al. Actor-critic algorithm with incremental dual natural policy gradient[J]. Journal on communications, 2017, 38(4): 166-177. DOI: 10.11959/j.issn.1000-436x.2017089.

  •  
  •  

0

浏览量

801

下载量

0

CSCD

文章被引用时,请邮件提醒。
提交
工具集
下载
参考文献导出
分享
收藏
添加至我的专辑

相关文章

支持合并的自适应tile coding算法
基于软提示微调和强化学习的网络安全命名实体识别方法研究
基于审计博弈的安全协作频谱感知方案
基于强化学习的在线离线混部云环境下的调度框架
基于深度强化学习的微服务多维动态防御策略研究

相关作者

施梦宇
傅启明
田泽庶
刘春雨
张云婷
张嘉宇
孟超
张宏莉

相关机构

哈尔滨工业大学计算学部
上海大学机电工程与自动化学院
西安交通大学网络空间安全学院
南开大学软件学院
北京大学计算机学院
0