李欢1, 贾佳1, 杨秀宇2, 宋春儒3
(1.中国矿业大学 信息与控制工程学院, 江苏 徐州 221008;2.山西中煤华晋能源有限责任公司 王家岭分公司, 山西 运城 043000;3.同煤国电同忻煤矿有限公司, 山西 大同 037000)
摘要:针对基于最小二乘支持向量机(LS-SVM)的瓦斯浓度预测方法进行参数优化时存在的易陷入局部最优解、搜索效率较低、易产生早熟收敛等问题,提出了一种基于改进蚁群算法-最小二乘支持向量机(ACO-LS-SVM)的瓦斯浓度预测模型。首先,对采集的大量煤矿综采工作面瓦斯数据进行k-means聚类分析,以降低数据维数;然后,采用改进蚁群算法对LS-SVM的惩罚参数和核函数参数进行寻优,再代入LS-SVM模型中进行回归预测。仿真结果表明,当瓦斯体积分数绝对误差阈值分别为0.03%,0.04%,0.05%时,基于ACO-LS-SVM的瓦斯浓度预测模型的预测准确度都在95%左右,比SVM模型和LS-SVM模型表现更好。
关键词:综采工作面; 瓦斯浓度预测; 蚁群算法; 最小二乘支持向量机; k-means聚类分析; 参数寻优; LS-SVM; ACO-LS-SVM
中图分类号:TD712
文献标志码:A
文章编号:1671-251X(2018)12-0048-06
DOI:10.13272/j.issn.1671-251x.17364
网络出版地址:http://kns.cnki.net/kcms/detail/32.1627.TP.20181119.1349.002.html
LI Huan1, JIA Jia1, YANG Xiuyu2, SONG Chunru3
(1.School of Information and Control Engineering, China University of Mining and Technology, Xuzhou 221008,China; 2.Wangjialing branch, Shanxi China Coal Huajin Energy Co., Ltd.,Yuncheng 043000, China; 3.Tongmei Guodian Tongxin Coal Mine, Datong 037000, China)
Abstract:In view of problems of gas concentration prediction method based on least squares support vector machine (LS-SVM) such as easy to fall into local optimal solution, low search efficiency and easy to occur premature convergence during parameter optimization process, a gas concentration prediction model based on ACO-LS-SVM was proposed. Firstly, k-means clustering analysis is performed on collected large amount of gas data on fully mechanized coal mining face to reduce dimension. Then, improved ant colony algorithm is used to optimize penalty parameters and kernel function parameters of LS-SVM, and the optimized parameters are substituted into the LS-SVM model for regression prediction. The simulation results show that when absolute error threshold of gas concentration is 0.03%, 0.04%, 0.05%, the prediction accuracy of the gas concentration prediction model based on ACO-LS-SVM is about 95%, which is better than SVM model and LS-SVM model.
Key words:fully mechanized coal mining face; gas concentration prediction; ant colony algorithm; least squares support vector machine; k-means cluster analysis; parameter optimization; LS-SVM; ACO-LS-SVM
收稿日期:2018-09-04;
修回日期:2018-11-05;
责任编辑:胡娴。
基金项目:国家重点研发计划项目(2016YFC0801808)。
作者简介:李欢(1992-),女,河南焦作人,硕士研究生,主要研究方向为数据挖掘,E-mail:zzulihuan@163.com。
引用格式:李欢,贾佳,杨秀宇,等.煤矿综采工作面瓦斯浓度预测模型[J].工矿自动化,2018,44(12):48-53.
LI Huan, JIA Jia, YANG Xiuyu, et al. Gas concentration prediction model for fully mechanized coal mining face[J].Industry and Mine Automation,2018,44(12):48-53.
煤炭是我国重要的能源,然而在煤炭生产过程中瓦斯突出灾害频发[1]。因此,及时准确地预测瓦斯浓度具有重要的意义。研究者们提出了基于BP神经网络[2]、粗糙集理论和支持向量机[3]、支持向量机、插值梯形模糊信息粒化[4]、模糊支持向量机(Support Vector Machine,SVM)[5]、最小二乘支持向量机(Least Squares-Support Vector Machine,LS-SVM)[6]等的瓦斯浓度预测方法。其中,LS-SVM有较好的表现。但是,LS-SVM的预测效果与惩罚参数和核函数参数有很大关联,因此,确定一组合适的参数是保证预测效果的关键。目前主要的方法是采用粒子群算法和遗传算法对上述2个参数进行优化[7-8]。然而,粒子群算法容易陷入局部最优解,遗传算法局部搜索能力较差,在进化后期搜索效率较低,易产生早熟收敛的问题。
本文采用改进蚁群(Ant Colony Optimization,ACO)算法[9]优化二元连续函数,达到优化惩罚参数和核函数参数、提高瓦斯浓度预测精度的目的。首先对煤矿综采工作面40个传感器采集的瓦斯数据进行聚类分析,得到相关性较高的一组数据,降低了数据维数;然后用ACO算法对惩罚参数和核函数参数进行优化,建立基于ACO-LS-SVM的瓦斯浓度预测模型(简称ACO-LS-SVM模型)。通过对比SVM模型、LS-SVM模型、ACO-LS-SVM模型的预测结果,验证了本文设计的模型可以有效提高瓦斯浓度预测精度。
设样本数为l,样本集为(xi,f(xi)),i=1,2,…,l,其中,xi为第i个输入向量,f(xi)为第i个输出向量,LS-SVM的回归模型为
f(xi)=ωTφ(xi)+b
(1)
式中:ω为权向量;b为偏置量;φ(·)为非线性映射,将样本映射到高维特征空间中。
根据结构风险最小化理论,LS-SVM回归问题可表示为优化如下约束问题:
f(xi)=ωTφ(xi)+b+ξi
(2)
式中:ξi为误差量;C为惩罚因子。
将径向基核函数作为LS-SVM的核函数,其表达式为
(3)
式中σ为核宽度。
引入径向基核函数和拉格朗日乘子αi,则LS-SVM回归预测模型可表示为
(4)
由式(2)—式(4)可以看出,LS-SVM回归预测模型的性能主要受到惩罚参数C和核函数参数σ的影响。优化这2个参数,可以提高模型预测的精确度。
ACO-LS-SVM模型的主要思想:用离散的点近似表示LS-SVM的惩罚参数和核函数参数,再用一层一层的“城市”表示这些离散的点,蚁群按照预先设定的搜索过程在“城市”之间搜索,直至得到最优结果。将最终寻优结果解码为具体数值,作为LS-SVM的惩罚参数和核函数参数,得到最优的预测模型,再对瓦斯浓度数据进行预测。
瓦斯浓度通常采用多个传感器协同预测,历史数据较多,而且有些传感器采集的数据与预测数据的相关性较低,这些数据不仅会影响预测精度,还会增加运行时间。为了避免这些问题,随机选取一个传感器采集的数据作为预测对象,采用k-means算法对所有数据进行聚类分析,以预测对象所在类中的一组聚类数据作为仿真数据。
蚁群算法在求解二次分配问题[10]、机器人路径规划问题[11]等方面效果很好。传统的蚁群算法适用于求解离散优化问题,不适合用来优化连续函数。文献[12]在传统的蚁群算法上做了改进,使得蚁群算法可以对二元连续函数进行优化求解。
根据文献[12],采用蚁群算法对LS-SVM的惩罚参数C和核函数参数σ进行优化。将2个参数都看作[0,1]之间的数,每个参数有d位小数,构造20d+3个“城市”,将“城市”分为2d+3层。用k表示“城市”的层数,用表示k-1层中代表十进制数a的“城市”与k层中代表十进制数c的“城市”之间的信息素残留量。算法执行过程中,蚂蚁n第m步所在的“城市”用T(n,m)表示。蚁群算法的参数取值:初始化信息素浓度τ0为0.01,参数位数d为5,蚂蚁个数N0为20,信息素减弱的速度ρ为0.8,用于确定蚂蚁选择“城市”概率的Q0为0.8,用于确定整体信息素更新的α为0.8,循环次数为100。
采用改进蚁群算法寻优的具体步骤:
(1) 将选定的仿真数据输入LS-SVM模型中进行初始化。
(2) 将所有蚂蚁放置在初始“城市”。
(3) 对k-1层到k层依次执行步骤(4)—步骤(9)。
(4) 对于每只蚂蚁,依次执行步骤(5)和步骤(6)。
(5) 确定蚂蚁第k层将要到达的城市。
(6) 每只蚂蚁完成选择后进行局部残留信息素的更新。
(7) 根据每只蚂蚁的搜索路径,按照式(5)和式(6)计算2个自变量的值,将值扩大10倍作为参数C和σ的值,代入初始化的LS-SVM模型中进行回归预测,得到预测数据。
(5)
(6)
(8) 将LS-SVM的训练误差函数作为蚁群算法优化的目标函数,根据式(7)计算误差值,然后选出最佳蚂蚁路径并执行全局信息素更新。
(7)
式中:F(C,σ)为LS-SVM的训练误差函数;L为训练集样本个数;yi为原始数据。
(9) 循环终止的条件是达到循环次数或者得到的解在某个循环次数后不再发生变化。判断是否满足终止条件,如果满足,输出结果,循环结束。
改进蚁群算法参数寻优流程如图1所示。
图1 改进蚁群算法参数寻优流程
Fig.1 Parameter optimization flow of improved ant colony algorithm
为了验证ACO-LS-SVM模型的可行性和有效性,采用Matlab平台的SVM和LS-SVM工具箱进行仿真分析。对ACO-LS-SVM、LS-SVM和SVM三种模型的预测结果进行对比。采用徐州矿务集团有限公司夹河煤矿7449工作面现场采集的瓦斯数据作为仿真数据。截至采集数据时,其开采深度已达到1 100~1 200 m,工作面煤层瓦斯压力为500~800 kPa,绝对瓦斯涌出量最高为15 m3/min。井下煤层可采走向的平均长度约为1 020 m,工作面倾向长度约为150 m。该工作面所采煤层厚度为1.5~2.5 m,煤层倾角为18~32°,采用综合机械化采煤工艺。
在横向工作面上每隔15 m设置1个瓦斯浓度监测点,共设10个监测点;每个监测点设置4个瓦斯传感器节点,共40个瓦斯传感器节点。瓦斯传感器位于液压支架上,其分布如图2所示,其中A,B,C,D四个点的位置即为传感器节点的具体位置。为了避免采煤机移动和落煤对瓦斯传感器的影响,传感器应尽可能贴近支架下平面,安装在距离支架下平面约30 cm的位置。
图2 瓦斯传感器分布
Fig.2 Distribution of gas sensors
为了保证数据能够可靠传输,采用Mesh结构的无线传感器网络。在进风巷靠近工作面处设置Sink节点,作为整个无线传感器网络的网关节点。工作面各个数据采集节点之间以自组织多跳的方式将瓦斯浓度数据传送到Sink节点,再由Sink节点通过工业以太网传输到地面工作站进行处理。传感器网络布局如图3所示。
图3 传感器网络布局
Fig.3 Layout of sensors network
工作面无线传感器网络采用ZigBee技术,节点的协议栈是ZigBee2007/PRO,主处理器是CC2530。信号放大电路将瓦斯传感器采集的电压信号转换成CC2530的A/D模块可以识别的信号,数据经CC2530滤波后通过ZigBee RF收发机发送出去[13]。
数据采集的时间间隔为5 s,共采集了40组数据,每组数据包含1 430个样本。由于井下环境复杂,瓦斯浓度受到多种情况的影响,所以在训练模型前,需要对采集的数据进行预处理。
首先处理缺失数据,如果数据严重缺失,应当舍弃;缺失值在可控范围内的数据采用三次样条插值法[14]进行处理。然后处理异常数据,如果在某个检测时间段内出现多个零值或者多个低频率的高瓦斯浓度数据,则认为该时间段内的数据为异常数据,同样采用三次样条插值法处理。最后,对数据进行归一化、标准化处理。处理后的瓦斯体积分数见表1。
表1 处理后的瓦斯体积分数
Table 1 Gas concentration after treatment
数据处理完成后,以传感器D10的数据作为预测目标,运用k-means算法对40组数据进行聚类分析,和D10传感器数据聚为一类的是传感器B8,B9,B10,C9,C10,D9的数据,聚类结果如图4所示。从图4可以看出,7组瓦斯数据在时间上具有相关性,因此,用另外6组数据去预测D10传感器的瓦斯数据,具有可行性。
图4 聚类结果
Fig.4 Clustering result
将传感器B8,B9,B10,C9,C10,D9的前1 000个数据作为模型的输入值,将传感器D10的前1 000个数据作为模型的输出值,分别对ACO-LS-SVM模型、LS-SVM模型和SVM模型进行训练。将传感器B8,B9,B10,C9,C10,D9的后430个数据输入到训练好的模型中,得到预测结果。3种模型的预测数据和原始数据对比如图5所示。图6对比了3种模型预测数据与原始数据的绝对误差情况。
(a) SVM模型
(b) LS-SVM模型
(c) ACO-LS-SVM模型
图5 3种模型的预测数据与原始数据对比
Fig.5 Comparison of prediction data and raw data of three models
(a) SVM模型
(b) LS-SVM模型
(c) ACO-LS-SVM模型
图6 3种模型的预测误差
Fig.6 Prediction error of three models
传感器D10预测集的瓦斯体积分数平均值为0.886 7%,分别设定绝对误差阈值为0.03%,0.04%,0.05%,计算3种模型绝对误差值在阈值内的样本点占全部样本点的比例,结果见表2。从表2可以看出,绝对误差阈值为0.05%时,3种模型准确度相差不多;绝对误差阈值为0.03%时,SVM模型的预测准确度只有76%,LS-SVM模型的预测准确度为90.89%,ACO-LS-SVM模型的预测准确度为94.44%。由此可见,ACO-LS-SVM模型预测准确度最高,LS-SVM模型效果次之,SVM模型预测效果最差。
表2 3种模型的瓦斯体积分数预测准确度对比
Table 2 Comparison of accuracy of gas concentration prediction of three models %
采用平均绝对误差(MAE)和均方根误差(RMSE)作为每一个样本点预测误差的评价指标,3种模型的瓦斯体积分数预测误差值对比见表3。
表3 3种模型的瓦斯体积分数预测误差对比
Table 3 Error comparison of gas concentration prediction of three models
根据式(8)计算优化后算法的精确度相比于未经优化算法的精确度提高的百分比p,其中,Y表示ACO-LS-SVM模型的均方根误差,X表示SVM模型或LS-SVM模型的均方根误差。
(8)
结合表3和式(8)可以得出,用蚁群算法对LS-SVM模型的参数C和σ进行优化后,预测精度相比于SVM模型提高了44.39%,相比于未经优化的LS-SVM模型提高了18.05%。
(1) 介绍了LS-SVM回归预测模型的原理,得出预测模型的性能主要受到惩罚参数C和核函数参数σ的影响。
(2) 提出了ACO-LS-SVM模型,采用改进蚁群算法优化惩罚参数和核函数参数,再代入LS-SVM模型中进行回归预测。
(3) 仿真结果表明,当绝对误差阈值分别为0.03%,0.04%,0.05%时,ACO-LS-SVM模型预测准确度都在95%左右,相比于SVM模型和LS-SVM模型,ACO-LS-SVM模型表现最好。
参考文献( References) :
[1] 闫江伟,张小兵,张子敏.煤与瓦斯突出地质控制机理探讨[J].煤炭学报,2013,38(7):1174-1178.
YAN Jiangwei,ZHANG Xiaobing,ZHANG Zimin.Research on geological control mechanism of coal-gas outburst[J].Journal of China Coal Society,2013,38(7):1174-1178.
[2] CHENG L,YAN-JU L,HONG-LIE Z.An improved coal and gas outburst prediction algorithm based on BP neural network[J].International Journal of Control & Automation,2015,8(6):169-176.
[3] 刘敏,王向前,朱佳.基于RS-SVM的瓦斯涌出量预测研究[J].辽宁工业大学学报(自然科学版),2018,38(1):52-56.
LIU Min,WANG Xiangqian,ZHU Jia.Study on prediction of gas emission based on RS-SVM[J].Journal of Liaoning University of Technology(Natural Science Edition),2018,38(1):52-56.
[4] 吴兆法,吴响,钱建生.基于插值梯形模糊信息粒化的瓦斯浓度趋势预测[J].工矿自动化,2014,40(12):31-36.
WU Zhaofa,WU Xiang,QIAN Jiansheng.Trend prediction of gas concentration based on interpolation trapezoidal fuzzy information granulation[J].Industry and Mine Automation,2014,40(12):31-36.
[5] 杨力,耿纪超,汪克亮.模糊支持向量机在煤与瓦斯突出预测中的研究[J].中国安全生产科学技术,2014,10(4):103-108.
YANG Li,GENG Jichao,WANG Keliang.Research on coal and gas outburst prediction using fuzzy support vector machines[J].Journal of Safety Science and Technology,2014,10(4):103-108.
[6] 付华,于翔,卢万杰.基于蚁群粒子群混合算法与LS-SVM瓦斯涌出量预测[J].传感技术学报,2016,29(3):373-377.
FU Hua,YU Xiang,LU Wanjie.Prediction of gas emission based on hybrid algorithm of ant colony particle swarm optimization and LS-SVM[J].Chinese Journal of Sensors and Actuators,2016,29(3):373-377.
[7] 李映洁,杨永国.基于改进PSO优化LS-SVM参数的煤与瓦斯突出预测研究[J].煤炭技术,2017,36(9):129-131.
LI Yingjie,YANG Yongguo.Prediction of coal and gas outburst based on improved PSO optimizing parameters of LS-SVM[J].Coal Technology,2017,36(9):129-131.
[8] 付华,史冬冬.基于IGA-LSSVM的煤矿瓦斯涌出量预测模型研究[J].中国安全科学学报,2013,23(10):51-55.
FU Hua,SHI Dongdong.Study on gas emission prediction model based on IGA-LSSVM[J].China Safety Science Journal,2013,23(10):51-55.
[9] DORIGO M,GAMBARDELLA L M.Ant colony system: a cooperative learning approach to the traveling salesman problem[J].IEEE Transactions on Evolutionary Computation,1997,1(1):53-66.
[10] 王艳愉,李强.必经点约束型最短路径问题的研究[J].微型机与应用,2017,36(22):26-29.
WANG Yanyu,LI Qiang.Study of shortest path problem constrained by designated-points[J].Microcomputer & Its Applications,2017,36(22):26-29.
[11] 游晓明,刘升,吕金秋.一种动态搜索策略的蚁群算法及其在机器人路径规划中的应用[J].控制与决策,2017,32(3):552-556.
YOU Xiaoming,LIU Sheng,LYU Jinqiu.Ant colony algorithm based on dynamic search strategy and its application on path planning of robot[J].Control and Decision,2017,32(3):552-556.
[12] 陈烨.用于连续函数优化的蚁群算法[J].四川大学学报(工程科学版),2004,36(6):117-120.
CHEN Ye.Ant colony system for continuous function optimization[J].Journal of Sichuan University (Engineering Science Edition),2004,36(6):117-120.
[13] 吴响.煤矿瓦斯场分布演化规律及其时空建模研究[D].徐州:中国矿业大学,2014.
[14] 陈赞.基于RBF神经网络的瓦斯测值分析及预测应用研究[D].西安:西安科技大学,2013.