留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

一类用于井下路径规划问题的Dyna_Q学习算法

朱美强 李明 张倩

朱美强, 李明, 张倩. 一类用于井下路径规划问题的Dyna_Q学习算法[J]. 工矿自动化, 2012, 38(12): 71-76.
引用本文: 朱美强, 李明, 张倩. 一类用于井下路径规划问题的Dyna_Q学习算法[J]. 工矿自动化, 2012, 38(12): 71-76.
ZHU Mei-qiang, LI Ming, ZHANG Qia. A Dyna_Q-learning Algorithm Used in Underground Path Planning[J]. Industry and Mine Automation, 2012, 38(12): 71-76.
Citation: ZHU Mei-qiang, LI Ming, ZHANG Qia. A Dyna_Q-learning Algorithm Used in Underground Path Planning[J]. Industry and Mine Automation, 2012, 38(12): 71-76.

一类用于井下路径规划问题的Dyna_Q学习算法

基金项目: 

国家自然科学基金资助项目(61273143)

中国矿业大学青年科技基金项目(OC080252

详细信息
  • 中图分类号: TD67

A Dyna_Q-learning Algorithm Used in Underground Path Planning

  • 摘要: 在基于目标的强化学习任务中,欧氏距离常用于Dyna_Q学习的启发式规划中,但对于井下救援机器人路径规划这类状态空间在欧氏空间内不连续的任务效果不理想。针对该问题,文章引入流形学习中计算复杂度较低的拉普拉斯特征映射法,提出了一种基于流形距离度量的改进Dyna_Q学习算法,并在类似于井下环境的格子世界中进行了仿真研究。仿真结果验证了该算法的有效性。

     

  • 加载中
计量
  • 文章访问数:  41
  • HTML全文浏览量:  5
  • PDF下载量:  4
  • 被引次数: 0
出版历程
  • 刊出日期:  2012-12-10

目录

    /

    返回文章
    返回