您当前的位置:
首页 >
文章列表页 >
基于自适应势函数塑造奖赏机制的梯度下降Sarsa(?)算法
学术论文 | 更新时间:2024-06-05
    • 基于自适应势函数塑造奖赏机制的梯度下降Sarsa(?)算法

    • Gradient descent Sarsa(?)algorithm based on the adaptive potential function shaping reward mechanism

    • 在强化学习领域,专家提出自适应势函数改进算法,利用ANRBF网络塑造奖赏机制,有效提升算法初始性能和收敛速度。
    • 通信学报   2013年34卷第1期 页码:77-89
    • DOI:1000-436X(2013)01-0077-12    

      中图分类号: TP181
    • 网络首发:2013-01

      纸质出版:2013-01-25

    移动端阅览

  • 肖飞, 刘全, 傅启明, 等. 基于自适应势函数塑造奖赏机制的梯度下降Sarsa(?)算法[J]. 通信学报, 2013,34(1):77-89. DOI: 1000-436X(2013)01-0077-12.

    Fei XIAO, Quan LIU, Qi-ming FU, et al. Gradient descent Sarsa(?)algorithm based on the adaptive potential function shaping reward mechanism[J]. Journal on Communications, 2013, 34(1): 77-89. DOI: 1000-436X(2013)01-0077-12.

  •  
  •  

0

浏览量

632

下载量

4

CSCD

文章被引用时,请邮件提醒。
提交
工具集
下载
参考文献导出
分享
收藏
添加至我的专辑

相关文章

基于RL-WGAN的5G网络异常数据生成方法
FTTR C-WAN架构下多AP协同的Co-EDCA机制研究
基于IPv6+的智能车联算网调度方案设计与实现
水下无线传感器网络节点定位方案综述
基于梯度下降的可变分数时延滤波器优化方法

相关作者

宁兆龙
邹道远
周力
欧阳瑞崎
熊炫睿
吴伟民
曾宸
于朝阳

相关机构

国防科技大学电子科学学院
重庆邮电大学通信与信息工程学院
华中科技大学电子信息与通信学院
北京邮电大学信息与通信工程学院
中国联合网络通信有限公司研究院
0