留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于强化学习的煤矸石分拣机械臂智能控制算法研究

张永超 于智伟 丁丽林

张永超,于智伟,丁丽林.基于强化学习的煤矸石分拣机械臂智能控制算法研究[J].工矿自动化,2021,47(1):36-42..  doi: 10.13272/j.issn.1671-251x.2020080047
引用本文: 张永超,于智伟,丁丽林.基于强化学习的煤矸石分拣机械臂智能控制算法研究[J].工矿自动化,2021,47(1):36-42..  doi: 10.13272/j.issn.1671-251x.2020080047
ZHANG Yongchao, YU Zhiwei, DING Lili. Research on intelligent control algorithm of coal gangue sorting robot armbased on reinforcement learning[J]. Industry and Mine Automation, 2021, 47(1): 36-42. doi: 10.13272/j.issn.1671-251x.2020080047
Citation: ZHANG Yongchao, YU Zhiwei, DING Lili. Research on intelligent control algorithm of coal gangue sorting robot armbased on reinforcement learning[J]. Industry and Mine Automation, 2021, 47(1): 36-42. doi: 10.13272/j.issn.1671-251x.2020080047

基于强化学习的煤矸石分拣机械臂智能控制算法研究

doi: 10.13272/j.issn.1671-251x.2020080047
基金项目: 

山东省自然科学基金项目(ZR2018MEE036)

详细信息
  • 中图分类号: TD67

Research on intelligent control algorithm of coal gangue sorting robot armbased on reinforcement learning

  • 摘要: 针对传统煤矸石分拣机械臂控制算法如抓取函数法、基于费拉里法的动态目标抓取算法等依赖于精确的环境模型、且控制过程缺乏自适应性,传统深度确定性策略梯度(DDPG)等智能控制算法存在输出动作过大及稀疏奖励容易被淹没等问题,对传统DDPG算法中的神经网络结构和奖励函数进行了改进,提出了一种适合处理六自由度煤矸石分拣机械臂的基于强化学习的改进DDPG算法。煤矸石进入机械臂工作空间后,改进DDPG算法可根据相应传感器返回的煤矸石位置及机械臂状态进行决策,并向相应运动控制器输出一组关节角状态控制量,根据煤矸石位置及关节角状态控制量控制机械臂运动,使机械臂运动到煤矸石附近,实现煤矸石分拣。仿真实验结果表明:改进DDPG算法相较于传统DDPG算法具有无模型通用性强及在与环境交互中可自适应学习抓取姿态的优势,可率先收敛于探索过程中所遇的最大奖励值,利用改进DDPG算法控制的机械臂所学策略泛化性更好、输出的关节角状态控制量更小、煤矸石分拣效率更高。

     

  • 加载中
计量
  • 文章访问数:  130
  • HTML全文浏览量:  23
  • PDF下载量:  14
  • 被引次数: 0
出版历程
  • 刊出日期:  2021-01-20

目录

    /

    返回文章
    返回