近距离煤层群综采工作面瓦斯治理优选措施

薛彦平

薛彦平.近距离煤层群综采工作面瓦斯治理优选措施[J].工矿自动化,2021,47(2):98-103.. DOI: 10.13272/j.issn.1671-251x.2020060055
引用本文: 薛彦平.近距离煤层群综采工作面瓦斯治理优选措施[J].工矿自动化,2021,47(2):98-103.. DOI: 10.13272/j.issn.1671-251x.2020060055
XUE Yanping. Optimal measures for gas control on fully mechanized working face of close-distance coal seam group[J]. Journal of Mine Automation, 2021, 47(2): 98-103. DOI: 10.13272/j.issn.1671-251x.2020060055
Citation: XUE Yanping. Optimal measures for gas control on fully mechanized working face of close-distance coal seam group[J]. Journal of Mine Automation, 2021, 47(2): 98-103. DOI: 10.13272/j.issn.1671-251x.2020060055

近距离煤层群综采工作面瓦斯治理优选措施

基金项目: 

国家科技重大专项资助项目(2016ZX05045-004-001)

详细信息
  • 中图分类号: TD712

Optimal measures for gas control on fully mechanized working face of close-distance coal seam group

  • 摘要: 相对于单一煤层或其他煤层群开采,近距离煤层群在开采过程中邻近层受到开采层应力影响更为剧烈,瓦斯更容易通过发育的裂隙涌入开采层,造成开采层工作面瓦斯积聚。现有的针对近距离煤层群的瓦斯治理研究主要侧重于单一措施参数的确定及效果分析,没有深入研究瓦斯治理措施在时间、空间层面之间的联系,对综合瓦斯治理措施的优选组合、具体参数的确定依据及措施采取后的效果分析不够深入。针对上述问题,以阳煤一矿81403综采工作面为研究对象,通过数值模拟方式分析了近距离煤层群条件下开采应力分布及演化过程,研究了上覆岩层破坏及裂隙发育变化规律,得到了81403综采工作面瓦斯主要来源为煤层解吸瓦斯、上邻近层卸压瓦斯、采空区瓦斯等,针对不同瓦斯涌出源头和特点,优先采取顺层预抽+高抽巷+高位钻孔+采空区埋管的瓦斯抽采措施,即在开采前充分预抽减少煤层解析瓦斯量,通过高位钻孔、高抽巷处理邻近层瓦斯涌入,采用埋管治理上隅角瓦斯局部聚集,在时间和空间上形成综合的治理体系,从而达到瓦斯治理目的。实际应用结果表明,工作面回采期间瓦斯抽采率达到了89.9%,回风巷及上隅角瓦斯体积分数保持在1%以下,保证了工作面的安全回采。
    Abstract: Compared with single coal seam or other coal seam group, the mining process of the close-distance coal seam group is more likely to be affected by the stress of the adjacent seam. Moreover, the gas is more likely to gush into the coal seam through the developed fissures, causing gas accumulation on the working face of the mining seam. The existing gas control research for close-distance coal seam group mainly focuses on the determination of single measure parameters and effect analysis, without in-depth research of the relationship between gas management measures in time and space. The researches on the optimal combination of comprehensive gas management measures, the basis for determining specific parameters and the effect analysis after the measures being taken are not sufficient enough. In order to solve the above problems, taking the 81403 fully mechanized working face of No.1 Coal Mine of Yangquan Coal Industry (Group) Co., Ltd. as the research object, the paper analyzes the stress distribution and evolution process of mining under the conditions of close-distance coal seam group through numerical simulation. The research studies the overlying rock destruction and fissures development change law, and proposes that the main sources of gas on the 81403 fully mechanized working face are coal seam desorption gas, pressure relief gas in upper adjacent coal seam and goaf gas, etc. Based on the different gas emission sources and characteristics, the paper proposes the gas extraction measures of bedding pre-extraction + high extraction roadway+high borehole+buried pipes in the extraction area. Before mining, pre-extraction is applied to reduce the amount of coal seam desorption gas. High extraction roadway and high borehole are used to deal with gas gush from adjacent coal seam. Buried pipes are used to control local gas accumulation in the upper corner. The measures form a comprehensive management system in time and space so as to achieve the purpose of gas control. Practical application results show that the gas extraction rate reaches 89.9% on the working face, and the gas volume fraction of the return airway and upper corner is kept below 1%, ensuring the safe mining of the working face.
  • 机器人在煤炭行业的应用研究是煤矿智能化技术创新的关键方向。作为机器人的核心组成部分,移动机器人已逐渐渗透到“采、掘、机、运、通”等煤矿生产的各个环节[1]。尤其是在面对如矿井采空区沉降监测、井下大面积危险区域监测等可并行完成的任务时,由多个具备简单结构与功能的同构机器人单元组成的群机器人系统可在任务执行效率方面展现出巨大优势[2]。在群机器人系统中,机器人单元之间的合作方式分为紧密型和松散型2种。紧密型合作方式主要基于行为技术、虚拟向量场技术实现机器人单元的高度协调运作,需要实时预知与优化多种因素,因此主要应用于机器人编队保持或合作搬运等强实时协作场景;松散型合作方式主要基于不同类型任务分配策略,在每个任务执行周期初始阶段实现机器人单元的任务分配,由于其对机器人单元实时性配合要求低,更适用于矿山救援、环境探测、灾害监测等任务中的未知区域探索和地图构建等场景[3-5]。因此,松散型合作群机器人系统在现阶段煤矿辅助机器人作业中有广泛应用前景。

    松散型合作群机器人系统中,任务被划分为多个子任务,并分配至群机器人系统中的机器人单元分别执行。任务划分是以机器人单元的预定义任务执行成本为基础。在任务分配完成后,机器人单元自身任务执行能力是任务执行效果最大的影响因素[6]。由于松散型合作方式关注的重点是任务分配问题,其任务划分过程被假定为已经在协作技术框架外完成,所以松散型合作的主要缺点是任务分配过程与任务划分过程不是一体化,任务分配过程不会向任务划分过程进行反馈,导致任务分配过程中遇到的错误不能被及时修正 [7-8] ,进而导致任务的整体执行周期过长,即任务执行高效性不足,同时任务执行过程中机器人个体的空闲率过高,即任务分配合理性不足。例如松散型合作方式中运用最广泛的任务分配算法——合同网算法中,每个机器人单元会根据预定义的成本和收入函数来计算每个任务的预期收益和损失,然而机器人单元的偏好和限制等因素只在任务分配阶段被考虑,并没有在任务划分阶段考虑,导致任务分配的合理性不足[9]

    鲁宾斯坦协商策略是博弈论方面的合作博弈模型,没有第三方强制结束机制与任何附加基础,最终分配结果完全由博弈参与方自身因素决定,可兼顾所有博弈参与方最大利益[10]。鲁宾斯坦协商策略主要用于解决双方合作之前对总任务量的分配问题,用完全信息动态博弈方法模拟基本的、无限期的完全信息讨价还价过程,并据此将整个博弈建立为完全信息轮流“出价−讨价−还价”模型[11]

    针对群机器人系统在任务划分与分配过程中高效性与合理性不足的问题,本文将鲁宾斯坦协商策略与群机器人系统松散型合作方式的任务划分与分配相融合,提出煤矿井下群机器人高效任务分配算法。首先,将鲁宾斯坦协商策略由双方博弈向多方共同博弈方向延伸;然后,基于机器人个体的不同执行能力及当前任务的执行情况,融入表示任务完成状态的反馈参数,构建折扣因子计算模型,最终实现任务的动态划分与分配;最后,通过3组机器人共同合作执行煤矿矿区整体监测任务,对算法的任务划分与分配策略进行验证,并对算法的高效性与合理性展开实验验证。

    在鲁宾斯坦协商策略中,根据轮流“出价−讨价−还价”模型,参与协商博弈的双方轮流提出希望得到的份额。博弈从发起者开始,得到报价的一方可选择接受报价,即最终达成协议,也可选择拒绝报价,并向对方提出新的报价。博弈过程会一直持续下去,直到博弈双方最终达成协议。该博弈过程参与方的出价方式都是加密的,每个参与方都不会掌握对方准确的出价方式,且通过运用鲁宾斯坦协商策略能够保证参与博弈的双方最终达成协议[12-13]

    在鲁宾斯坦协商策略模型中,参与双方都有一个与其自身特征相匹配的折扣因子,折扣因子越小,通过博弈最终所得任务份额越少。折扣因子为参与方的加密信息,对方无法得到该信息。假设总任务量为1,参与双方首次提出的任务份额均接近总任务量(一般取总任务量的99%),且提出的任务份额随博弈轮数的增加逐渐减小。随着博弈的进行,提出报价的参与方新要求的任务份额K与上一轮要求任务份额L之间关系为[14-15]

    $$ K = \delta L $$ (1)

    式中$\delta $为折扣因子,$0 < \delta < 1$。

    将协商发起者和响应者的折扣因子分别记为${\delta _1}$和${\delta _2}$,首次提出的任务份额分别记为$p$和$q$,协商过程如图1所示。发起者先出价$p$,响应者可以接受或拒绝1$ - p$的份额。如果响应者接受,则博弈结束,博弈结果按发起者提出的方案执行;如果响应者拒绝,则响应者出价(还价)$q$,发起者可以接受或拒绝$1 - q$的份额;如果发起者接受,则博弈结束,博弈结果按响应者提出的方案执行;如果发起者拒绝,发起者再出价${\delta _1}p$;如此持续进行下去,直到参与博弈的某一方出价被另一方接受为止。因此这是一个无限期完全信息博弈,发起者在轮数1,3,5,…出价,响应者在轮数2,4,6,…出价。

    图  1  博弈协商过程
    Figure  1.  Game negotiation process

    鲁宾斯坦协商策略的博弈过程长度不确定,通过运用有限阶段逆向归纳法可获取博弈平衡点[16]。假设在第$i$ ($i \geqslant 3$)轮博弈时参与人1出价$M$,参与人2在得到份额为$1 - M$后达成协议。当第i轮博弈时的M等价于第$i - 1$轮博弈时的${\delta _1}M$,参与人2在第$i - 1$轮博弈时得到$1 - {\delta _1}M$。同理,当第$i - 1$轮博弈时的$1 - {\delta _1}M$等价于第$i - 2$轮博弈时的${\delta _2}(1 - {\delta _1}M)$,参与人1在第$i - 2$轮博弈时得到$1 - {\delta _2}(1 - {\delta _1}M)$,如图2所示,因此可得博弈结束时参与人1理论上能够得到的份额,即理论博弈平衡点M

    $$ M = 1 - {\delta _2}(1 - {\delta _1}M) \Leftrightarrow M = {{(1 - {\delta _2})} \mathord{\left/ {\vphantom {{(1 - {\delta _2})} {(1 - {\delta _1}{\delta _2})}}} \right. } {(1 - {\delta _1}{\delta _2})}} $$ (2)
    图  2  理论博弈平衡点建立过程
    Figure  2.  The establishment process of theoretical game equilibrium point

    由于参与双方出价策略具有保密性,博弈过程中双方无法通过理论博弈平衡点判断博弈是否结束,所以只能通过参与博弈的某一方判断对方的剩余报价是否大于自身在下一轮博弈中准备提出的报价,如果大于自身准备提出的报价,则博弈结束,否则进行下一轮的博弈[17-18]

    群机器人任务划分与分配问题可看作多方合作博弈的过程。根据群机器人系统的工作特点,遵循鲁宾斯坦协商策略中提出的轮流“出价−讨价−还价”思想,将鲁宾斯坦协商策略参与方的数量由限定的双方协商向多方共同协商的方向进行拓展延伸,通过对任务完成的状态进行实时反馈,使群机器人在任务划分与分配过程中体现出高效性和合理性[19]

    基于改进型鲁宾斯坦协商策略的群机器人任务采用“循环出价,末位决定”原则进行博弈。在$n$个参与方共同博弈的过程中,由前$n - 1$个参与方分别提出希望得到的份额,第$n$个参与方选择接受或拒绝,如果选择接受,则博弈结束,博弈结果按照前$n - 1$个参与方提出的份额进行划分与分配;如果选择拒绝,则第$n$个参与方与前$n - 2$个参与方再分别提出希望得到的份额,第$n - 1$个参与方选择接受或拒绝,如果选择接受,则博弈结束,博弈结果按前$n - 2$个参与方与第$n$个参与方提出的份额进行划分与分配;如果选择拒绝,则前$n - 3$个与后2个参与方再分别提出希望得到的份额,第$n - 2$个参与方选择接受或拒绝;依此类推,直到最终任务划分与分配份额被所有参与方接受为止[20]

    以3方共同协商博弈为例(图3),将协商参与方的折扣因子分别记为${\delta _1}$,${\delta _2}$,${\delta _3}$,首次提出的任务份额分别记为XYZ。第1轮博弈由参与方A和参与方B先出价,参与方C可以接受或拒绝。如果参与方C接受,则博弈结束,博弈结果按照参与方A和参与方B提出的方案执行;如果参与方C拒绝,第2轮博弈开始,参与方C和参与方A共同出价(还价),参与方B可以接受或拒绝;如果参与方B接受,则博弈结束,博弈结果按参与方C和参与方A提出的方案执行;如果参与方B拒绝,第3轮博弈开始,参与方B和参与方C再出价;如此一直进行下去,直到出价被3个参与方都接受为止。

    图  3  3方共同协商的博弈过程
    Figure  3.  The game process of tripartite joint consultation

    折扣因子$\delta $表示任务参与方对任务的执行能力,是根据各参与方的自身特征来确定的加密参数,对任务最终的分配比例起着决定性作用。折扣因子的影响因素有诸多方面,每个影响因素的变化对折扣因子造成的影响程度差别很大。根据任务的不同,将影响因素分为主要部分和次要部分,这里只考虑对任务划分有较大影响的主要部分。

    如果影响因素大小与单位时间内完成的任务量成正比,则随着影响因素数值增大,单位时间内完成的任务量变化趋势为递增(如果影响因素大小与单位时间内完成任务量成反比,则取影响因素的倒数作为其数值)。任取多个对数型、指数型及比例型3种典型递增模式的影响因素进行分析,如图4所示。首先给出影响因素数值$x$与单位时间完成的任务量$ f $之间的关系,可知随着不同影响因素数值的增大,单位时间内完成任务量的递增趋势差别较大。完成单位任务量所需时间为$ t $,则$ t $和$ f $之间的关系为$ t = {1 \mathord{\left/ {\vphantom {1 f}} \right. } f} $,则基于$ x $与$ f $之间的变化关系,可得影响因素数值$ x $与$ t $的关系,当$ x $一定时,$ t $越大表示任务完成效率越低。

    图  4  影响因素与任务量的关系
    Figure  4.  Relationship between influencing factors and task quantity

    基于$ x $与$ t $的变化关系,用折扣因子$ \delta $表示$ 1 - t $,即表示影响因素对任务的影响能力,可得影响因素数值$ x $与其折扣因子$ \delta $的关系,如图5所示。可看出随着影响因素数值增大,如果单位时间内完成任务量增大的幅度越大,即折扣因子增长越快,则该影响因素对任务的影响能力就越大,意味着该影响因素越重要。

    图  5  影响因素与折扣因子的关系
    Figure  5.  Relationship between influencing factors and discount factor

    影响因素数值$ x $与折扣因子$ \delta $间的关系为

    $$ \delta = \frac{2}{{\text{π }}}\arctan (x r) $$ (3)

    式中$ r $为影响因素的权重系数,$ 0 < r \leqslant 1 $,r越大,单位时间完成的任务量越多,折扣因子越大,即越重要。

    以指数型、对数型及比例型3种典型增长曲线为例,对影响因素数值$ x $与折扣因子$ \delta $之间的关系进行验证,结果如图6所示。首先取3种影响因素数值$ x $与单位时间完成任务量$ f $的数据,分别满足上述3种典型类型变化趋势,如图6(a)所示。根据影响因素数值$ x $、完成单位任务量所需时间$ t $及折扣因子$ \delta $之间的转换关系,可得影响因素数值$ x $与其折扣因子$ \delta $关系,如图6(b)所示。可看出随着影响因素数值增大,指数型增长模式在单位时间内完成任务量增大幅度最大,折扣因子增长最快,即该影响因素重要性最大,比例型增长次之,对数型增长最小。

    图  6  3种典型增长类型的影响因素对比
    Figure  6.  Comparison of influencing factors for three typical growth types

    分别为3种影响因素选取合适权重系数,代入式(3)进行验证,其中指数型增长的权重系数$ {r_1} = 0.078 $,对数型增长$ {r_2} = 0.009 $,比例型增长$ {r_3} = 0.025 $,将所得的计算结果与图6(b)中理论结果进行对比,结果如图7所示。可看出折扣因子计算结果与理论结果之间的误差在0.02范围内,所以在权重系数选择恰当的前提下,式(3)可对影响因素与折扣因子间的关系进行较好描述。

    图  7  3种典型增长类型的计算与理论结果对比
    Figure  7.  Comparison of calculation and theoretical results of the three typical growth types

    由于影响因素之间是耦合的,针对多个影响因素对折扣因子产生的影响,影响因素数值$ x $与折扣因子$ \delta $的关系为

    $$ \delta = \frac{2}{{\text{π}} }\arctan \left( {k {\prod\limits_{j = 1}^m {{x_j} {r_j}} } } \right) $$ (4)

    式中:$ k $为任务完成状态反馈参数;$ m $为影响因素总数;xj为第j个影响因素数值;rj为第j个影响因素的权重系数。

    在折扣因子中引入任务完成状态反馈参数$ k $,对上一个分配周期任务执行情况进行评估,根据评估结果对任务划分与分配情况进行调整,使群机器人系统最大限度地发挥自身任务执行能力,进而高效完成任务。任务完成状态反馈参数$ k $为

    $$ k = \frac{W}{{{W_{{\rm{average}}}}}} $$ (5)

    式中:$ W $为任务执行度参数,表示在上一个分配周期中完成的任务量与分配总任务量比值;$ {W_{{\rm{average}}}} $为平均任务执行度参数,表示上一个分配周期中所有任务参与方任务执行度参数的算术平均数。

    第1个分配周期(任务划分的初始阶段)进行任务划分与分配时$ k = 1 $。

    改进型鲁宾斯坦协商策略的最大特点是任务划分与分配由原来的双方进行博弈改进为多方博弈。由于最终的博弈平衡需要满足所有参与方的需求份额,所以其博弈过程更为复杂,持续时间更长。

    改进型鲁宾斯坦协商策略基于有限阶段逆向归纳法寻找多方博弈的理论协商博弈平衡点:$ n $个参与方进行博弈,每个参与方的折扣因子分别为$ {\delta _1} $−${\delta _n} $,博弈过程如图8所示。在第$i$($i \geqslant n$)轮博弈时编号为1−$ n - 1 $的参与方分别出价$ {M_1} $−${M_{n - 1}} $,编号为$ n $的参与方得到剩余份额${s_0}$后达成协议。因为第$i$轮博弈时的${M_1}$等价于第$i - 1$轮博弈时的$ {\delta _1}{M_1} $,参与方$ n $在第$i - 1$轮博弈时最多得到$ {s_n} $;因为第$i - 1$轮博弈时的$ {M_2} $等价于第$i - 2$轮博弈时的$ {\delta _2}{M_2} $,参与方1在第$i - 2$轮博弈时至少得到$ {s_1} $;因为第$i - 2$轮博弈时的$ {M_3} $等价于第$i - 3$轮博弈时的$ {\delta _3}{M_3} $,参与方2在第$i - 3$轮博弈时至少得到$ {s_2} $;依次类推,在第$i - n + 1$轮博弈时的$ {s_n} $等价于第$i - n$轮博弈时的$ {\delta _n}{s_n} $,参与方$ n - 1 $在第$i - n$轮博弈至少得到$ {s_{n - 1}} $。

    图  8  $ n $个参与方进行博弈的理论协商博弈平衡点计算过程
    Figure  8.  Calculation process of theoretical negotiation game equilibrium point of game played by n participants

    根据第$i$轮博弈时各参与方所得份额等价于第$i - n$轮博弈时所得的份额,可得

    $$ \left\{ \begin{array}{l} M_1=s_1 \\ M_2=s_2 \\ \qquad \vdots \\M_{n-1}=s_{n-1} \\ M_n=s_0 \end{array} \right. $$ (6)

    该方程组的未知数分别为参与人1−n的所得份额$ {M_1} $−$ {M_n} $,求解该方程组即可得出参与人1−n通过改进型鲁宾斯坦协商策略进行博弈后所得的理论协商博弈平衡点。

    $$ \begin{split} {M_J} = \left\{ {\begin{array}{*{20}{l}} \dfrac{{\displaystyle \prod_{i = 1}^n {({\delta _i} - 1)} }}{{({\delta _J} - 1)   \left[ {\displaystyle \prod_{i = 1}^n {({\delta _i} - 1)} + \displaystyle \sum_{J = 1}^n {\left( {{\raise0.7ex\hbox{${\displaystyle \prod_{i = 1}^n {({\delta _i} - 1)} }$} \mathord{\left/ {\vphantom {{\displaystyle \prod_{i = 1}^n {({\delta _i} - 1)} } {({\delta _J} - 1)}}}\right.} \lower0.7ex\hbox{${({\delta _J} - 1)}$}}} \right)} } \right]}}\;, \\ J = 1,2 \cdots ,n - 1 \\ \dfrac{{{\delta _n}   \displaystyle \prod_{i = 1}^n {({\delta _i} - 1)} }}{{({\delta _n} - 1)   \left[ {\displaystyle \prod_{i = 1}^n {({\delta _i} - 1)} + \displaystyle \sum_{J = 1}^n {\left( {{\raise0.7ex\hbox{${\displaystyle \prod_{i = 1}^n {({\delta _i} - 1)} }$} \mathord{\left/ {\vphantom {{\displaystyle \prod_{i = 1}^n {({\delta _i} - 1)} } {({\delta _J} - 1)}}}\right.} \lower0.7ex\hbox{${({\delta _J} - 1)}$}}} \right)} } \right]}}{\text{, }} \\ J = n{\text{ }} \end{array}} \right. \end{split} $$ (7)

    以工业级四旋翼无人机组共同完成某煤矿矿区整体监测任务作为实验背景,对基于改进型鲁宾斯坦协商策略的群机器人任务划分与分配算法的高效性与合理性进行验证。工业级四旋翼无人机外形与视角如图9所示,技术参数见表1。在任务执行过程中,当完成任务划分与分配后,运用Web+GIS技术自动生成和优化作业航线。运用电子围栏与飞行控制系统相配合的方式规划作业区域和禁飞区域,其中任务区域的总面积为3.498 m2。无人机群依据规划航线自主飞行,实现任务区域遍历[21-22]

    图  9  实验装备与区域
    Figure  9.  Experimental equipment and area
    表  1  无人机技术参数
    Table  1.  Technical parameters of unmanned aerial vehicles
    机体尺寸/m直径1.4,高0.6
    最大飞行速度/(km·h−1)21
    空载质量/kg7
    最大抗风能力/级7
    满载续航时间/min45
    下载: 导出CSV 
    | 显示表格

    实验准备阶段,将13架无人机分为3组,每一组作为一个参与方参与任务划分与分配过程的博弈。对每组无人机的最大运动速度进行限制,使无人机的飞行能力实现差异化。3组无人机的个数与飞行速度见表2

    表  2  3组无人机数量及飞行速度
    Table  2.  Number and running speed of three groups of unmanned aerial vehicles
    组别无人机数量/架最大飞行速度/(km·h−1)
    138.9
    264.2
    343.8
    下载: 导出CSV 
    | 显示表格

    进行任务区域划分前需确定3组无人机的初始折扣因子。主要影响因素有每组无人机数量和运行速度,取无人机数量权重系数$ {r_1} = 0.95 $,机器人运行速度权重系数$ {r_2} = 0.85 $,任务完成状态反馈参数$ k = 1 $。根据式(4)可得3组无人机的初始折扣因子分别为$ {\delta _1} = 0.982 \; 3 $,$ {\delta _2} = 0.976 \; 5 $,$ {\delta _3} = 0.965 \; 5 $。设每一次任务划分与分配周期为120 s,总任务份额为1,在明确任务区域的总面积和3组无人机的折扣因子后,根据式(6)可得3组无人机的理论协商博弈平衡点,分别为0.363 5,0.325 6,0.310 9。

    根据3组无人机的参数,运用改进型鲁宾斯坦协商策略对任务份额进行划分,博弈过程如图10所示。博弈共进行了47轮,在第1轮博弈中,第1组和第2组无人机的初始出价(期望份额)为0.49,则第3组无人机得到的初始份额为0.02,小于其在第2轮博弈中准备提出的报价0.49,则3组无人机进入第2轮的博弈。依此类推,第2组无人机得到的报价为0.336 0,大于其在下一轮博弈中准备提出的报价0.335 1,则博弈过程结束,3组无人机得到博弈的平衡。在第1个分配周期的初始阶段,3组无人机分配的任务份额分别为0.374 8,0.336 0,0.289 2,与理论协商博弈平衡点相比,误差份额保持在0.05范围内。误差产生的原因是,通过式(6)只需要经过1步计算即可得出理论博弈平衡点,但实际平衡点需要通过多步协商博弈获取,每一步计算产生的误差均会得到累计。

    图  10  第1个分配周期中3组无人机的博弈过程
    Figure  10.  Game process of three groups of unmanned aerial vehicle in the first assignmen cycle

    由于任务执行过程中受风速、任务区域轮廓等因素影响,第1个分配周期中每组无人机对分配所得任务的完成情况有较大差别。第1个分配周期结束后任务区域的剩余面积,即第2个分配周期任务区域总面积为3.303 km2

    根据式(5)计算第1个分配周期的任务完成状态反馈参数,对3组无人机的任务执行情况进行评估,根据评估情况对折扣因子进行适应性调整。第1个分配周期中3组无人机对任务的完成情况与状态反馈参数见表3。将$ k $代入式(4),可得3组无人机的折扣因子:$ {\delta _1} = 0.985 \; 9 $, $ {\delta _2} = 0.976 \; 2 $,$ {\delta _3} = 0.953 \; 8 $。

    表  3  第1个分配周期的任务完成情况与状态反馈参数
    Table  3.  Task completion and status feedback parameters in the first assignment cycle
    无人机组别123
    分配任务面积/ km21.3111.1751.012
    完成任务面积/ km20.09060.06430.0401
    任务执行度参数/%6.915.473.96
    任务完成状态反馈参数1.26851.00420.7270
    下载: 导出CSV 
    | 显示表格

    在第2个分配周期的初始阶段,根据第2个分配周期的任务区域面积和3组无人机的折扣因子,运用改进型鲁宾斯坦协商策略对任务区域进行新一轮的划分与分配,在进行了44轮博弈后得到协商博弈平衡,3组无人机获得的任务份额分别为0.402 2,0.344 9,0.252 9。

    3组无人机共同执行矿区整体监测任务共经历15个分配周期。每组无人机在不同分配周期的任务完成情况如图11所示。受外界(如地形、气候等不可抗拒因素)影响,同一组无人机在不同分配周期完成的任务量相差较大,除第15个分配周期外,第1组无人机在单个分配周期完成任务量task_1变化范围为0.071 4~ 0.125 8 km2,第2组无人机在单个分配周期完成任务量task_2的变化范围为0.052 4~ 0.100 8 km2,第3组无人机在单个分配周期完成任务量task_3的变化范围为0.041 2~0.082 9 km2

    图  11  3组无人机在不同分配周期的任务完成情况
    Figure  11.  Task completion of three groups of unmanned aerial vehicle in different assignment cycles

    在每个分配周期初始阶段,通过分析上个分配周期中每组无人机任务执行情况,即每组无人机的执行水平与任务总体执行水平之间的关系,确定任务完成状态反馈参数$ k $。通过式(4)对折扣因子$ \delta $进行调整,进而通过改进型鲁宾斯坦协商策略对每个任务分配周期的任务划分比例$ p $进行调整。任务执行过程中,在任务比例划分阶段,3组无人机在不同分配周期的反馈参数$ k $、折扣因子$ \delta $、划分比例h的变化情况如图12所示。可看出划分比例h的变化趋势与任务完成状态反馈参数$ k $的变化趋势基本相符,即在前一个分配周期中任务执行水平较高的无人机组,在下一周期中所分配的任务量会随之增大,相反地,任务执行水平较低的无人机组在下一周期中分配的任务量随之降低,实现了执行能力的最大化。

    不同分配周期的博弈轮数如图13所示,可看出运用改进型鲁宾斯坦协商策略,每个分配周期的博弈轮数保持在40~50之间,稳定地解决了区域遍历任务过程中的任务划分分配问题。

    图  12  不同分配周期的反馈参数$ k $、折扣因子$ \delta $、划分比例h变化情况
    Figure  12.  Changes of feedback parameter $ k $, discount factor $ \delta $ and division proportion h in different assignment cycles
    图  13  不同分配周期的博弈轮数
    Figure  13.  Number of game rounds in different assignment cycles

    为了比较算法在任务划分与分配方面的高效性,分别运用3种不同的任务划分与分配算法进行煤矿矿区整体监测任务实验,实验中设置相同的无人机数量、运行速度及任务区域面积。每种任务划分与分配算法分别进行3次实验,取3次实验经历的平均时间作为参考。

    算法1通过计算每组无人机数量与运行速度的乘积,将乘积的比例直接作为3组无人机任务划分与分配的标准,即每组无人机分配的任务份额分别为0.441 2,0.333 0,0.225 8;算法2使用多方共同协商的鲁宾斯坦协商策略,但不考虑任务完成状态反馈参数$ k $,任务的分配和执行过程不会向任务划分过程进行反馈,3组无人机分配的任务份额始终为0.374 8,0.336 0,0.289 2;算法3采用改进型鲁宾斯坦协商策略,实现任务的动态划分与分配。由于无人机续航能力弱的缺点不可避免,无人机电池更换时间不在实验计时范围内。

    通过对总体任务执行过程进行计时,实现对3种不同任务划分与分配算法高效性的对比。基于3种算法的任务执行过程所经历的时间见表4。可看出算法3的任务划分与分配效率较算法1、算法2分别提升了30.10%,18.29%。

    表  4  3种任务划分与分配算法实验时间
    Table  4.  Experiment time of three task partition division and assignment algorithms s
    时间
    实验1实验2实验3平均值
    算法11 3441 4581 3941 399
    算法21 2381 1521 2021 197
    算法39869451 003978
    下载: 导出CSV 
    | 显示表格

    通过对每组无人机的任务执行过程进行计时,实现对3种不同的任务划分与分配算法合理性的对比。每组无人机的平均任务执行时间见表5。可看出基于算法1的3组无人机执行任务的平均最大时间差为188 s,即无人机组在执行完任务之后平均有188 s的等待时间,这段时间内部分无人机组处于空闲状态,而部分无人机一直处于任务执行状态;同理,基于算法2的3组无人机执行任务的平均最大时间差为121 s,这是由于算法2运用了多方共同协商的鲁宾斯坦协商策略,该策略通过折扣因子优化了影响因素(无人机数量和运行速度)与任务划分与分配结果之间的关系,避免了影响因素随着其数值增大导致的冗余问题;基于算法3的3组无人机执行任务的平均最大时间差为42 s,较算法1、算法2分别优化了77.66%,65.29%,这是由于算法3通过引入任务完成状态反馈参数$ k $,及时对任务参与方的任务执行过程进行评估,将任务的分配和执行过程向任务的划分阶段进行反馈,使任务的划分与分配更加准确。

    表  5  每组无人机的任务执行时间
    Table  5.  Task execution time of each group of unmanned aerial vehicle s
    平均作业时间最大组别时间差
    机组1机组2机组3
    算法1133714821294188
    算法21 26211411189121
    算法39939791 03542
    下载: 导出CSV 
    | 显示表格

    由实验结果可知,运用改进型鲁宾斯坦协商策略对任务进行划分与分配,能够最大化地发挥群机器人的任务执行能力,体现了改进型鲁宾斯坦协商策略在任务划分与分配方面的高效性和合理性优势。

    1) 将鲁宾斯坦协商策略中的双方博弈向多方共同博弈的方向拓展延伸;以对任务最终分配起决定性作用的影响因素为研究对象,提出了折扣因子计算方法,根据该方法能够量化参与方对任务的执行能力;在折扣因子中引入任务完成状态反馈参数,通过评估对所分配任务的执行程度,对任务划分与分配情况进行调整。

    2) 基于3组无人机合作开展煤矿矿区监测任务实验,对算法的高效性与合理性进行了验证。验证结果表明:算法3的任务划分与分配效率较算法1、算法2分别提升了30.10%,18.29%;基于算法3的3组无人机执行任务的平均最大时间差为42 s,较算法1、算法2分别优化了77.66%与65.29%。

  • 期刊类型引用(0)

    其他类型引用(2)

计量
  • 文章访问数: 
  • HTML全文浏览量: 
  • PDF下载量: 
  • 被引次数: 2
出版历程
  • 发布日期:  2021-02-19
  • 刊出日期:  2021-02-25

目录

/

返回文章
返回