基于强化学习的煤矸石分拣机械臂智能控制算法研究

张永超, 于智伟, 丁丽林

张永超,于智伟,丁丽林.基于强化学习的煤矸石分拣机械臂智能控制算法研究[J].工矿自动化,2021,47(1):36-42.. DOI: 10.13272/j.issn.1671-251x.2020080047
引用本文: 张永超,于智伟,丁丽林.基于强化学习的煤矸石分拣机械臂智能控制算法研究[J].工矿自动化,2021,47(1):36-42.. DOI: 10.13272/j.issn.1671-251x.2020080047
ZHANG Yongchao, YU Zhiwei, DING Lili. Research on intelligent control algorithm of coal gangue sorting robot armbased on reinforcement learning[J]. Journal of Mine Automation, 2021, 47(1): 36-42. DOI: 10.13272/j.issn.1671-251x.2020080047
Citation: ZHANG Yongchao, YU Zhiwei, DING Lili. Research on intelligent control algorithm of coal gangue sorting robot armbased on reinforcement learning[J]. Journal of Mine Automation, 2021, 47(1): 36-42. DOI: 10.13272/j.issn.1671-251x.2020080047

基于强化学习的煤矸石分拣机械臂智能控制算法研究

基金项目: 

山东省自然科学基金项目(ZR2018MEE036)

详细信息
  • 中图分类号: TD67

Research on intelligent control algorithm of coal gangue sorting robot armbased on reinforcement learning

  • 摘要: 针对传统煤矸石分拣机械臂控制算法如抓取函数法、基于费拉里法的动态目标抓取算法等依赖于精确的环境模型、且控制过程缺乏自适应性,传统深度确定性策略梯度(DDPG)等智能控制算法存在输出动作过大及稀疏奖励容易被淹没等问题,对传统DDPG算法中的神经网络结构和奖励函数进行了改进,提出了一种适合处理六自由度煤矸石分拣机械臂的基于强化学习的改进DDPG算法。煤矸石进入机械臂工作空间后,改进DDPG算法可根据相应传感器返回的煤矸石位置及机械臂状态进行决策,并向相应运动控制器输出一组关节角状态控制量,根据煤矸石位置及关节角状态控制量控制机械臂运动,使机械臂运动到煤矸石附近,实现煤矸石分拣。仿真实验结果表明:改进DDPG算法相较于传统DDPG算法具有无模型通用性强及在与环境交互中可自适应学习抓取姿态的优势,可率先收敛于探索过程中所遇的最大奖励值,利用改进DDPG算法控制的机械臂所学策略泛化性更好、输出的关节角状态控制量更小、煤矸石分拣效率更高。
    Abstract: The problems of the traditional gangue sorting robot arm control algorithms such as the grasping function method and the dynamic target grasping algorithm based on Ferrary method are relying on an accurate environment model and lacking adaptivity in the control process. At the same time, the problems of the traditional intelligent control algorithms such as deep deterministic policy gradient (DDPG) are excessive output actions and sparse rewards that are easily covered. In order to solve these problems, this study improves the neural network structure and reward function in the traditional DDPG algorithm, and proposes an improved DDPG algorithm based on reinforcement learning, which is suitable for handling six-degree-of-freedom gangue sorting robot arms. After the gangue enters the working space of the robot arm, the improved DDPG algorithm can make decisions according to the gangue position and robot arm state returned by the corresponding sensor, and can output a set of joint angle state control quantity to the corresponding motion controller. The algorithm can control the movement of the robot arm according to the gangue position and joint angle state control quantity, so that the robot arm moves to the nearby gangue to conduct gangue sorting. The simulation results show that compared with the traditional DDPG algorithm, the improved DDPG algorithm has the advantages of model-free versatility and adaptive learning of grasping pose in interaction with the environment. Moreover, the improved algorithm can be the first to converge to the maximum reward value encountered during exploration. The robot arm controlled by the improved DDPG algorithm has better policy generalization, smaller joint angle state control output and higher gangue sorting efficiency.
  • 综掘工作面超前支护问题是长期困扰煤炭生产的技术难题。在巷道掘进过程中,由于巷道地应力的作用,顶板会产生塑性变形或松动破坏[1-2],巷道掘进后顶板不能得到有效支护,经常会造成顶板掉矸、冒落等事故,威胁工人生命安全。因此,对巷道顶板进行快速有效的临时支护具有重要意义[3-4]。为了对巷道顶板进行有效支护,应防止过支护和欠支护对顶板造成破坏[5],研究临时支架的支撑力自适应控制,使支护支架的支撑力能够与矿压相适应。

    国内学者对支架的初撑力控制及PID控制优化等进行了大量研究。卢进南[6]通过薄板理论和厚板理论验证了顶板破坏的力学指标,并给出了支护支架工作阻力选择范围和初撑力确定方式。王国法等[7]分析了液压支架与顶板及两帮相互作用关系的力学模型,确定了液压支架的工作阻力,并通过理论分析与数值模拟结合的方法进行了验证。栾丽君等[8]通过伺服电动机和定量泵相结合的方法进行速度、压力控制,用滑膜变结构算法作为控制算法,实现了压力、速度复合控制。胡相捧等[9]通过基于BP神经网络的PID算法对液压支架初撑力进行调控,使液压支架快速而准确地达到预定的初撑力。薛光辉等[10]建立了支架支撑力调控系统数学模型,通过BP神经网络优化后的PID算法对系统进行调控,使支架支撑力有效跟随矿压变化。姜磊等[11]将粒子群优化(Particle Swarm Optimization,PSO)−BP神经网络应用到电动机故障诊断中,实时监测采煤机的运行状态。

    目前国内外对临时支架的支撑力自适应控制研究尚处于起步阶段,为了使临时支架的支撑力更好地与矿压相适应,提高支架的支护能力,本文通过PSO−BP神经网络优化PID控制参数,并通过优化后的PID算法对临时支架支撑力系统进行控制。通过PSO算法对BP神经网络的权值进行优化,提高BP神经网络的收敛速度,再通过优化后的BP神经网络实现PID参数的在线自调整,使临时支架的支撑力更快速、准确地达到预定值,实现临时支架支撑力自适应控制,避免因支护力和顶板压力不匹配而对顶板造成破坏。

    临时支架结构如图1所示。该临时支架2个1组,通过上顶板和护帮板分别与巷道的顶板和两帮接触,进行支护。支架随着掘进工作前移时,前架的液压支撑油缸和护帮板千斤顶收缩,使前架的顶板和护帮板与巷道分离,实现降架。后架处于支护状态,依靠其与巷道间的摩擦阻力保持稳定,并推移油缸伸长,将前架向前推动一定距离。前架到达预定位置进行支护,后架按同样方式进行降架后,前架推移油缸收缩,拉动后架前移,实现支架整体的前移运动。支架通过护帮板千斤顶来调节临时支架的支护宽度,以适应不同的巷道宽度。

    图  1  双联自移式临时支护支架结构
    1—底座;2—支架护帮板;3—护帮板千斤顶;4—顶板千斤顶;5—上顶板;6—下顶板;7—液压支撑油缸;8—推移油缸。
    Figure  1.  Structure of dual self-moving temporary support

    临时支架支撑力控制系统主要由支撑液压缸、电液伺服阀、溢流阀、油液压力传感器等组成,如图2所示。在临时支架上安装压力传感器,对巷道顶板压力进行实时检测,通过换算得到液压油所需提供的油液压力。通过油液压力传感器检测油液压力,并与液压油所需提供的油液压力进行比较,获得支撑力和顶板压力偏差的误差信号,控制器接收到误差信号并进行分析处理后,产生控制电压信号。电液伺服阀根据经放大器放大的控制信号调整开口大小,控制油缸内的油压,使支架的支撑力能够跟随矿压变化,实现临时支架的自适应控制。

    图  2  临时支撑力控制系统结构
    1—油箱;2—滤油器;3—电动机;4—液压泵;5—电液伺服阀;6—液压锁;7—油液压力传感器;8—支撑液压缸;9—溢流阀。
    Figure  2.  Structure of support force control system of temporary support

    临时支架支撑力控制系统原理如图3所示,其中r为输入信号,即顶板的实际矿压,y为支架输出的支撑力,e为实际矿压与支撑力之间的误差,de为误差变化率。将redey作为PSO−BP神经网络的输入信号,通过PSO−BP神经网络对PID控制参数进行优化,再通过优化PID算法控制临时支架输出与顶板压力相适应的支撑力。

    图  3  临时支架支撑力控制系统原理
    Figure  3.  Principle of support force control system of temporary support

    构建数学模型前,作如下假设:电液伺服阀和液压缸通过粗短的油管连接;液压油在管道中流动的过程中不存在压力损失;各个工作腔中液压油的压力都相等;油温、体积、弹性模量为常值;忽略液压缸的渗漏[12]

    电液伺服阀可看成比例环节,其流量连续性方程为

    $$ {Q_{\rm{L}}} = {k_{\rm{q}}}{X_{\text{v}}} - {k_{\rm{c}}}{P_{\rm{L}}} $$ (1)

    式中:QL为液压缸输入流量,m3/s;kq为电液伺服阀的流量与阀芯位移的比例增益,L/(min·m);Xv为电液伺服阀的阀芯位移,m;kc为电液伺服阀的流量与阀出口处油压的比例增益,L/(min·MPa);PL为电液伺服阀出口处油压,MPa。

    液压缸输入流量还可表示为

    $$ {Q_{\rm{L}}} = {A_{\rm{q}}}s{X_{\rm{q}}} + {C_{{\rm{ip}}}}{P_{\rm{L}}} + \frac{{{V_{\rm{e}}}}}{{4{\beta _{\rm{e}}}}}{{s}}{P_{\rm{L}}} $$ (2)

    式中: Aq为液压支撑油缸有效工作截面积,cm2s为拉普拉斯变换的复变量;Xq为支撑液压缸活塞位移,m;Cip为液压支撑油缸的总泄漏系数,L/(min·MPa);Ve为系统的总压缩体积系数;$\; {\beta _{\rm{e}}} $为液压油体积模量,Pa。

    液压缸力平衡方程为

    $$ F = {A_{\rm{q}}}{P_{\rm{L}}} = {M_{\rm{t}}}{{{s}}^2}{X_{\rm{q}}} + {B_{\rm{p}}}{{s}}{X_{\rm{q}}} + {K_{\rm{s}}}{X_{\rm{q}}} $$ (3)

    式中:F为液压缸输出力,kN;$ {M}_{\mathrm{t}} $为液压支撑油缸活塞上等效的惯性总负载,kg;$ {B}_{\mathrm{p}} $为活塞及负载的阻尼系数,$ \mathrm{N} \cdot \mathrm{s}/\mathrm{m} $;$ {K}_{\mathrm{s}} $为负载弹簧刚度,N/m。

    由式(1)−式(3)可得液压缸输出力与阀芯位移的关系,即传递函数:

    $$\begin{split} & {{{G}}_{\rm{p}}}(s) = \\ &\dfrac{{\dfrac{{{k_{\rm{q}}}}}{{{A_{\rm{q}}}}}{K_{\rm{s}}}\left( {1 + \dfrac{{{B_{\rm{p}}}}}{{{K_{\rm{s}}}}}s + \dfrac{{{M_{\rm{t}}}}}{{K{}_{\rm{s}}}}{{{s}}^2}} \right)}}{{\dfrac{{{M_{\rm{t}}}{V_{\rm{e}}}}}{{4{\beta _{\rm{e}}}A_{\rm{q}}^2}}{{{s}}^3} + \left( {\dfrac{{{M_{\rm{t}}}{k_{{\rm{ce}}}}}}{{A_{\rm{q}}^2}} + \dfrac{{{B_{\rm{p}}}{V_{\rm{e}}}}}{{4{\beta _{\rm{e}}}A_{\rm{q}}^2}}} \right){{{s}}^2} + \left( {1 + \dfrac{{{B_{\rm{p}}}{k_{{\rm{ce}}}}}}{{A_{\rm{q}}^2}}} \right){{s}} + \dfrac{{{K_{\rm{s}}}{k_{{\rm{ce}}}}}}{{A_{\rm{q}}^2}}}} \end{split} $$ (4)
    $$ {k_{{\rm{ce}}}} = {k_{\rm{c}}} + {C_{{\rm{ip}}}} $$ (5)

    不考虑弹性负载的影响,可将液压缸的传递函数简化为

    $$ {G_{\rm{p}}}({{s}}) = \dfrac{F}{{{X_{\rm{v}}}}} = \dfrac{{\dfrac{{{k_{\rm{q}}}}}{{{k_{{\rm{ce}}}}}}{A_{\rm{q}}}\left( {1 + \dfrac{{{{{s}}^2}}}{{\omega _{\rm{n}}^2}}} \right)}}{{\left( {\dfrac{{{{{s}}^2}}}{{\omega _0^2}} + \dfrac{{2{\zeta _0}}}{{{\omega _0}}}{{s}} + 1} \right)\left( {1 + \dfrac{s}{{{\omega _{\rm{h}}}}}} \right)}} $$ (6)

    式中:ωn为负载固有频率,Hz;ω0为液压弹簧与机械弹簧串联产生的固有频率,Hz;ζ0为系统的阻尼比;ωh为转折频率,Hz。

    用二阶振荡环节表示电液伺服阀输入和输出的关系,其传递函数为

    $$ {G_{\rm{v}}}\left( {{s}} \right) = \dfrac{{{k_{\rm{v}}}}}{{\dfrac{{{{{s}}^2}}}{{\omega _{\rm{v}}^2}} + \dfrac{{2{\zeta _{\rm{v}}}}}{{{\omega _{\rm{v}}}}}{{s}} + 1}} $$ (7)

    式中:kv为电液伺服阀阀芯的位移增益,m/A;ωv为电液伺服阀的固有频率,Hz;ζv为电液伺服阀的阻尼比。

    伺服放大器和压力传感器的输出信号对输入信号具有较快的响应速度,可将其视为比例环节,由此可得系统的开环传递函数为

    $$ \begin{split} G\left( {{s}} \right) =& {k_{\rm{a}}}{k_{\rm{f}}}{G_{\rm{p}}}\left( {{s}} \right){G_{\rm{v}}}\left( {{s}} \right) =\\& \dfrac{{{k_0}\left( {1 + \dfrac{{{{{s}}^2}}}{{\omega _{\rm{n}}^2}}} \right)}}{{\left( {\dfrac{{{{{s}}^2}}}{{\omega _0^2}} + \dfrac{{2{\zeta _0}}}{{{\omega _0}}}{{s}} + 1} \right)\left( {1 + \dfrac{s}{{{\omega _{\rm{h}}}}}} \right)\left( {\dfrac{{{{{s}}^2}}}{{\omega _{\rm{v}}^2}} + \dfrac{{2{\zeta _{\rm{v}}}}}{{{\omega _{\rm{v}}}}}{{s}} + 1} \right)}} \end{split} $$ (8)
    $$ {k_0} = {k_{\rm{a}}}{k_{\rm{f}}}{k_{\rm{v}}}\frac{{{k_{\rm{q}}}}}{{{k_{{\rm{ce}}}}}}{A_{\rm{q}}} $$ (9)

    式中:ka为伺服放大器的增益,A/V;kf为压力传感器的增益,V/N。

    临时支架支撑力控制系统参数见表1。将系统参数代入式(8)和式(9)中,可得临时支架支撑力控制系统的传递函数。

    表  1  临时支架支撑力控制系统参数
    Table  1.  Parameters of support force control system of temporary support
    参数数值
    液压缸内腔直径/mm130
    液压缸活塞杆外径/mm80
    kq/(L∙min−1∙m−1)27 000
    kce/(L∙min−1∙MPa−1)0.06
    Aq/cm284.425
    ωn/Hz502.4
    ωh/Hz0.13
    ω0/Hz842.5
    ζ00.15
    kv/(m∙A−1)0.056
    ωv/Hz110
    ζv0.7
    ka/(A∙V−1)0.007
    kf/(V∙N−1)100
    下载: 导出CSV 
    | 显示表格

    通过Matlab软件绘制双联自移式临时支架支撑力控制系统的性能曲线,如图4所示。可看出系统是稳定的,具有正的幅值裕度gm和相位裕度zm,但相角裕度此时较小,可采用降低系统开环增益的方法,提高系统的幅值裕度和相位裕度,增强系统的稳定性。

    图  4  临时支架支撑力控制系统性能曲线
    Figure  4.  Performance curves of support force control system of temporary support

    在临时支架支撑力控制系统中加入比例环节提高系统稳定性,比例环节的传递函数为

    $$ G_{\rm{b}}\left( s \right) = 0.1 $$ (10)

    调整后系统的Bode图如图5所示,可看出系统的幅值裕度和相位裕度明显增加。

    图  5  调整后系统Bode图
    Figure  5.  Bode diagram of the adjusted system

    BP神经网络具备非线性映射能力,适合求解内部机制复杂的问题,但初始权值设置不当会导致收敛速度慢及因陷入局部最小值而得到非最优解[13-15]。BP神经网络采用误差逆传播算法进行网络训练,是一种相邻层神经元全互联的网络模型。BP神经网络包括输入层、隐含层和输出层,如图6所示[16-17]

    图  6  BP神经网络结构
    Figure  6.  BP neural network structure

    设输入层信号为R,$ {{\boldsymbol{R}}=[{r}_{1}\;\;{r}_{2}{ \;\; \cdots \;\;r}_{N}]}^{\mathrm{T}} $,输入层含有N个神经元,根据实际被控对象的情况进行选择;输出层信号为O,${{\boldsymbol{O}}=[{O}_{1}\;\;{O}_{2}{ \;\; \cdots \;\; O}_{m}]}^{\mathrm{T}}$,输出层含有m个神经元;隐含层具有h个神经元。各层的输出为

    $$ {Y_j} = f\left( {\sum\limits_{i = 1}^N {{v_{ij}}{x_i}} } \right)\;\;\; j = 1,2, \cdot \cdot \cdot, h $$ (11)
    $$ {O_q} = f\left( {\sum\limits_{j = 1}^h {{v_{jq}}{Y_j}} } \right)\;\;\; q = 1,2, \cdot \cdot \cdot ,m $$ (12)

    式中:Yj为隐含层第j个神经元的输出信号;f(·)为隐含层和输出层的激活函数,多采用sigmoid函数;vij为输入层第i个神经元与隐含层第j个神经元间的权值;xi为输入层第i个神经元的输出信号;Oq为输出层第$q $个神经元的输出信号;vjq为隐含层第j个神经元与输出层第$q $个神经元间的权值。

    PSO算法是一种简单成熟的全局搜索算法,具有快速逼近最优解的能力[18-19]。PSO算法通过粒子迭代寻找最优解,所有粒子都具有相同的维数,且仅具有速度和位置2种属性[20]。每个粒子的初始赋值都是按照通用问题设置的,粒子的适应度值由目标函数计算确定,每个粒子以个体最佳位置及群体最佳位置作为目标进行移动,粒子的速度和位置不断调整,将每次迭代中比当前群体最佳位置好的位置更新为群体最佳位置。迭代过程中通过速度迭代公式和位置迭代公式不断更新粒子的速度和位置[21]。速度迭代公式和位置迭代公式为

    $$ \begin{split} {S_a}\left( {n + 1} \right) =& w{S_a}\left( n \right) + {c_1}{R_1}\left[ {p_{{a}}{t_a}\left( n \right) - {L_a}\left( n \right)} \right] + \\& {c_2}{R_2}\left[ {p_{\rm{g}}\left( n \right) - {L_a}\left( n \right)} \right] \end{split} $$ (13)
    $$ {L_a}\left( {n + 1} \right) = {L_a}\left( n \right) + {S_{a + 1}}\left( {n + 1} \right) $$ (14)

    式中:$ {S}_{a} $(n)和${L}_{a}$(n)分别为第a个粒子在第n次迭代时的速度和位置;$ w $为惯性权重,非负数,用来改变粒子的位置;$ {c}_{1} $和$ {c}_{2} $为加速度常数;$ {R}_{1} $和$ {R}_{2} $为0~1的随机数;$ {p_{{a}}}\left(n\right) $和$ p_{\rm{g}}\left(n\right) $分别为第n次迭代中粒子个体最优解和群体最优解。

    PSO优化算法具有鲁棒性高、收敛速度快的特点,可以克服BP神经网络的缺陷。

    传统PID的参数多根据经验设定且设定后不再更改,虽然具有一定控制效果,但很难实现最优控制,尤其是面对控制临时支架根据复杂顶板来压提供相适应支撑力这种复杂工况。为了实现对临时支架支撑力的有效控制,需要运用优化算法对传统PID控制器进行优化,实现其比例、积分、微分参数的在线整定。

    BP神经网络优化PID控制器依靠BP神经网络的自学习和自适应能力,根据系统输入、输出及误差大小和变化实现PID参数的在线自调整,具备对复杂工况的控制能力,并实现了较好的控制效果。但存在初始权值选取不当会影响收敛速度和陷入局部最小值的弊端,无法快速、准确地输出期望值,不能使临时支架的支撑力快速、准确跟随顶板压力。

    针对上述问题,利用PSO算法的全局搜索能力及快速收敛特性对BP神经网络的初始权值进行优化,再通过优化后的BP神经网络实现PID参数在线自调整,即构建PSO−BP神经网络优化PID控制器,以有效改善神经网络的收敛速度和训练能力,提高对复杂系统的控制能力。PSO−BP神经网络优化PID控制器的控制算法步骤如下:

    1) 确定BP神经网络的结构。BP神经网络的输入信号包括实时的巷道顶板来压、支架支撑力、二者的误差及误差变化率,故输入层需要4个神经元。由于要优化和调整PID的3个控制参数,输出层需要3个神经元。隐含层设置为5层。学习速率取0.6,惯性权重取0.1。初始化种群数选50,$ {c}_{1} $和$ {c}_{2} $均取2,迭代次数选60。

    2) 初始化粒子的位置和速度。

    3) 计算粒子的适应度值。为使临时支架的支撑力能够跟随巷道顶板来压,以支撑力与顶板来压的误差平方作为适应度函数,以此判断粒子位置优劣。

    4) 每个粒子以个体最佳位置及群体最佳位置作为目标进行移动,不断调整粒子的速度和位置,获得经PSO优化后的BP神经网络的初始权值。

    5) BP神经网络根据输入信号及权值信息对输出信号进行计算,得到优化后的PID参数。计算得到PID输出及临时支架液压系统输出的支撑力。

    6) BP神经网络通过反向传播调整各层的权值,实现对PID参数的在线自动更新。

    为了减小巷道顶板变形,使支架更快达到预定的支撑力,用单位阶跃信号模拟期望支撑力,可根据实际情况对阶跃信号进行修改。分析PSO−BP神经网络优化PID控制器与BP神经网络优化PID控制器的控制效果并进行比较。

    初撑力响应曲线如图7所示。在PSO−BP神经网络优化PID控制器控制下,系统上升时间为0.5 s,相较于BP神经网络优化PID控制器减少了37.5%,与传统PID控制器相比减少了45.65%。PID控制器经PSO−BP神经网络优化后,系统上升时间短,响应速度快,有利于减少巷道的下沉。在PSO−BP神经网络优化PID控制器控制下,系统基本不存在超调,而在BP神经网络优化PID控制器控制下,系统超调量为38.59%,在传统PID控制器控制下,系统的超调量为64.36%。超调量越小,支护系统输出的支撑力越稳定,对顶板的支护效果越好。

    图  7  初撑力响应曲线
    Figure  7.  Response curves of initial support force

    初撑力误差曲线如图8所示。可看出在PSO−BP神经网络优化PID控制器控制下,系统输出支撑力误差最小,调整时间最短;在BP神经网络优化PID 控制器控制下的系统误差比传统PID控制器控制下的系统误差小,但调节时间偏长。通过以上分析可以发现,PSO−BP神经网络对临时支架支撑力控制系统的优化效果最好,能使支架的支撑力快速、准确地到达预定值。

    图  8  初撑力误差曲线
    Figure  8.  Error curves of initial support force

    为了分析在PSO−BP神经网络优化下临时支架支撑力跟随顶板压力自适应变化的能力,防止顶板因欠支护及过支护而产生破坏,根据徐州矿务集团有限公司旗山煤矿实际地质情况,依据摩尔−库伦屈服准则,通过FLAC3D建立地质模型,如图9所示,其中steel liner为支架位置。煤矿地质参数见表2,各岩层力学参数见表3

    图  9  巷道地质仿真模型
    Figure  9.  Roadway geological simulation models
    表  2  煤矿地质参数
    Table  2.  Coal mine geological parameters
    顶底板名称岩层名称厚度/m平均厚度/m
    基本顶砂岩2.28~11.977.29
    直接顶泥岩0.5~13.85.4
    煤层0.66~3.243
    直接底泥岩2.82.8
    基本底泥岩44
    下载: 导出CSV 
    | 显示表格
    表  3  各岩层力学参数
    Table  3.  Mechanical parameters of each rock layer
    岩层
    名称
    密度/
    (kg·m−3)
    体积
    模量/GPa
    剪切
    模量/GPa
    黏聚
    力/MPa
    内摩擦
    角/(°)
    砂岩265063.63.035
    泥岩255052.31.228
    165042.51.024
    砂质
    泥岩
    200053.02.033
    下载: 导出CSV 
    | 显示表格

    仿真获得巷道顶板压力变化曲线,将顶板压力作为系统的输入,分析临时支架支撑力控制系统输出的支撑力对顶板压力的跟随效果,结果如图10所示。3种控制方法均能使临时支架的支撑力有效跟随围岩压力变化,PSO−BP神经网络优化PID控制器效果最好,优于BP神经网络优化PID控制器,传统PID控制器的效果最差。

    图  10  临时支架支撑力自适应控制曲线
    Figure  10.  Support force adaptive control curves of temporary support

    临时支架支撑力自适应控制误差曲线如图11所示。在PSO−BP神经网络优化PID控制器控制下,系统误差不超过0.02 MPa,在BP神经网络优化PID控制器控制下,系统最大误差为0.054 7 MPa,在传统PID控制器控制下,系统最大误差为0.074 3 MPa。PSO−BP神经网络优化PID控制器对支撑力的控制效果更好,可使临时支架的支撑力较好地跟随矿压变化。

    图  11  临时支架支撑力自适应控制误差曲线
    Figure  11.  Error curves of support force adaptive control of temporary support

    与传统PID控制器、BP神经网络优化PID控制器相比,PSO−BP神经网络优化PID控制器能控制临时支架的支撑力以更快的速度和更小的误差达到期望值或跟随巷道顶板压力变化,对巷道顶板进行合理有效支护。

    1) 基于双联自移式临时支架进行临时支架支撑力自适应控制方法研究,分析了支架结构和工作原理,根据支架支撑力控制系统的工作原理建立了数学模型,提出了基于PSO−BP神经网络优化PID控制器的支撑力自适应控制方法。

    2) 用单位阶跃信号模拟临时支架的期望初撑力进行实验验证,结果表明,PSO−BP神经网络优化PID控制器能以较快的速度和较高的精度对临时支架这种复杂系统进行控制,调整时间仅为0.5 s且超调量为0,控制效果优于 BP神经网络优化PID控制器及传统PID控制器。

    3) 根据实际地质条件仿真模拟开挖支护过程中支架受到的顶板压力,研究3种控制器的支撑力自适应控制效果,结果表明,在PSO−BP神经网络优化PID控制器的控制下,系统误差仅为0.02 MPa,误差最小,控制效果最好。

  • 期刊类型引用(7)

    1. 汤捷中. 基于遗传算法优化BP神经网络的内燃机轴承故障诊断方法. 内燃机与配件. 2024(03): 19-21 . 百度学术
    2. 张能,汪川迪,安鹏,张羽,王利达,王杰. 基于PSO-BP的油气井钻速预测技术优化与仿真实验. 粘接. 2024(06): 19-22 . 百度学术
    3. 赵庆浩,周军,荆丰伟. 基于自适应变异的粒子群优化BP神经网络的液压缸故障诊断方法. 机电产品开发与创新. 2024(04): 103-107 . 百度学术
    4. 马宏伟,李烺,薛旭升,王川伟,王赛赛,赵英杰,周文剑,张恒. 护盾式临时支护机器人带压行驶液压控制系统研究. 工矿自动化. 2024(07): 21-31 . 本站查看
    5. 姚钰鹏,熊武. 基于动态自适应旗鱼优化BP神经网络的工作面周期来压预测. 工矿自动化. 2024(08): 30-37 . 本站查看
    6. 黄登臣. 基于粒子群算法的临时支架优化分析. 西部交通科技. 2024(08): 84-87 . 百度学术
    7. 王云飞,赵继云,张鹤,王浩,张阳. 基于神经网络补偿的液压支架群推移系统直线度控制方法. 煤炭科学技术. 2024(11): 174-185 . 百度学术

    其他类型引用(1)

计量
  • 文章访问数:  140
  • HTML全文浏览量:  23
  • PDF下载量:  20
  • 被引次数: 8
出版历程
  • 刊出日期:  2021-01-19

目录

/

返回文章
返回