您当前的位置:
首页 >
文章列表页 >
最小状态变元平均奖赏的强化学习方法
学术论文 | 更新时间:2024-10-14
    • 最小状态变元平均奖赏的强化学习方法

    • Reinforcement learning algorithm based on minimum state method and average reward

    • 通信学报   2011年32卷第1期 页码:66-71
    • 中图分类号: TP181
    • 纸质出版日期:2011

    移动端阅览

  • 刘全, 傅启明, 龚声蓉, 等. 最小状态变元平均奖赏的强化学习方法[J]. 通信学报, 2011,32(1):66-71. DOI:

    LIU Quan1, FU Qi-ming1, GONG Sheng-rong1, et al. Reinforcement learning algorithm based on minimum state method and average reward[J]. 2011, 32(1): 66-71. DOI:

  •  
  •  

0

浏览量

232

下载量

14

CSCD

文章被引用时,请邮件提醒。
提交
工具集
下载
参考文献导出
分享
收藏
添加至我的专辑

相关文章

基于软提示微调和强化学习的网络安全命名实体识别方法研究
基于审计博弈的安全协作频谱感知方案
基于强化学习的在线离线混部云环境下的调度框架
基于深度强化学习的微服务多维动态防御策略研究
面向智能渗透攻击的欺骗防御方法

相关作者

田泽庶
刘春雨
张云婷
张嘉宇
孟超
张宏莉
王云涛
苏洲

相关机构

哈尔滨工业大学计算学部
上海大学机电工程与自动化学院
西安交通大学网络空间安全学院
北京大学计算机学院
南开大学软件学院
0