您当前的位置:
首页 >
文章列表页 >
基于两层模糊划分的时间差分算法
学术论文 | 更新时间:2024-06-05
    • 基于两层模糊划分的时间差分算法

    • TD algorithm based on double-layer fuzzy partitioning

    • 在强化学习领域,研究者提出了DFP-OPTD算法,有效解决了连续空间问题,为求解连续行为策略提供新方案。
    • 通信学报   2013年34卷第10期 页码:92-99
    • DOI:10.3969/j.issn.1000-436x.2013.10.011    

      中图分类号: TP181
    • 网络出版日期:2013-10

      纸质出版日期:2013-10-25

    移动端阅览

  • 穆翔, 刘全, 傅启明, 等. 基于两层模糊划分的时间差分算法[J]. 通信学报, 2013,34(10):92-99. DOI: 10.3969/j.issn.1000-436x.2013.10.011.

    Xiang MU, Quan LIU, Qi-ming FU, et al. TD algorithm based on double-layer fuzzy partitioning[J]. Journal on communications, 2013, 34(10): 92-99. DOI: 10.3969/j.issn.1000-436x.2013.10.011.

  •  
  •  

0

浏览量

172

下载量

0

CSCD

文章被引用时,请邮件提醒。
提交
工具集
下载
参考文献导出
分享
收藏
添加至我的专辑

相关文章

基于软提示微调和强化学习的网络安全命名实体识别方法研究
基于审计博弈的安全协作频谱感知方案
基于强化学习的在线离线混部云环境下的调度框架
基于深度强化学习的微服务多维动态防御策略研究
面向智能渗透攻击的欺骗防御方法

相关作者

田泽庶
刘春雨
张云婷
张嘉宇
孟超
张宏莉
王云涛
苏洲

相关机构

哈尔滨工业大学计算学部
上海大学机电工程与自动化学院
西安交通大学网络空间安全学院
北京大学计算机学院
南开大学软件学院
0