您当前的位置:
首页 >
文章列表页 >
增量式双自然策略梯度的行动者评论家算法
学术通信 | 更新时间:2024-06-05
    • 增量式双自然策略梯度的行动者评论家算法

    • Actor-critic algorithm with incremental dual natural policy gradient

    • 通信学报   2017年38卷第4期 页码:166-177
    • DOI:10.11959/j.issn.1000-436x.2017089    

      中图分类号: TP181
    • 网络首发:2017-04

      纸质出版:2017-04-25

    移动端阅览

  • 章鹏, 刘全, 钟珊, 等. 增量式双自然策略梯度的行动者评论家算法[J]. 通信学报, 2017,38(4):166-177. DOI: 10.11959/j.issn.1000-436x.2017089.

    Peng ZHANG, Quan LIU, Shan ZHONG, et al. Actor-critic algorithm with incremental dual natural policy gradient[J]. Journal on Communications, 2017, 38(4): 166-177. DOI: 10.11959/j.issn.1000-436x.2017089.

  •  
  •  
icon
试读结束,您可以激活您的VIP账号继续阅读。
去激活 >
icon
试读结束,您可以通过登录账户,到个人中心,购买VIP会员阅读全文。
已是VIP会员?
去登录 >

0

浏览量

1576

下载量

0

CSCD

文章被引用时,请邮件提醒。
提交
工具集
下载
参考文献导出
分享
收藏
添加至我的专辑

相关文章

支持合并的自适应tile coding算法
基于RL-WGAN的5G网络异常数据生成方法
FTTR C-WAN架构下多AP协同的Co-EDCA机制研究
基于IPv6+的智能车联算网调度方案设计与实现
水下无线传感器网络节点定位方案综述

相关作者

施梦宇
傅启明
宁兆龙
邹道远
周力
欧阳瑞崎
熊炫睿
吴伟民

相关机构

国防科技大学电子科学学院
重庆邮电大学通信与信息工程学院
华中科技大学电子信息与通信学院
北京邮电大学信息与通信工程学院
中国联合网络通信有限公司研究院
0