煤自燃不仅给煤矿生产带来极大不便,一旦发生爆炸,还会对矿工的生命安全造成极大威胁[1-2]。煤自燃的有效预防是煤矿安全生产的关键,对煤自燃程度的准确预测是煤自燃预防的前提。煤自燃过程中,指标气体浓度会随煤质氧化的程度发生变化,因此,可通过检测及分析该过程中指标气体浓度来预测煤自燃温度,达到预测煤自燃程度的目的[3-5]。
近年来,学者们通过各种机器学习算法对指标气体浓度与煤自燃温度的关系展开了研究。文献[6]通过径向基(Radial Basis Function, RBF)神经网络学习方法研究了气体浓度与煤自燃温度之间的关系。文献[7]通过支持向量机(Support Vector Machine, SVM)的改进算法对煤自燃温度进行预测。RBF神经网络方法用于预测煤自燃具有非线性映射能力与泛化能力强的优点,然而易陷入局部最优,网络结构复杂;SVM虽可避免“维数灾难”,适用于小样本数据集,但核函数受Mercer条件的限制,对参数的选择敏感[8];传统的机器学习算法对煤自燃温度进行预测时存在较大误差。
针对上述问题,本文结合贝叶斯、极大似然估计等理论,提出了基于相关向量机[9-10](Relevance Vector Machine,RVM)的煤自燃程度预测方法,根据特征气体浓度准确地对煤自燃温度进行预测。
RVM回归通过引入超参数并假设权值向量为零均值的高斯先验分布确保模型的稀疏性[11-12],超参数可采用最大边缘似然方法估计[13]。设模型的输入为为训练集中第i组输入向量,S为训练集样本数,RD为D维实数域;t为训练样本输出值ti组成的目标向量,即t=[t1,t2,…,ti,…,tS]T,ti为第i个训练样本输出值,i=1,2,…,S。RVM回归的输入与输出之间的关系为
ti=y(w,xi)+εi
(1)
(2)
式中:y(w,xi)为由权值决定的输出值;w为S+1维权值wj组成的向量,j=0,1,…,S,即w=[w0,w1,…,wj,…,wS]T;x是由xi组成的矩阵,即x=[x1,x2,…,xi,…,xS]T;εi为第i个噪声误差,εi~N(0,δ2),N(·)为高斯分布,δ2为高斯噪声的方差;k(x,xi)为核函数k(xn,xi)组成的核向量,即k(x,xi)=[k(x1,xi),k(x2,xi),…,k(xi,xi),…,k(xS,xi)],n=1,2,…,S。
当ti相互独立时,训练样本的极大似然函数为
(3)
式中φ为核函数k(xn,xi)组成的核矩阵,即φ=[φ(x1),φ(x2),…,φ(xn),…,φ(xS)]T,φ(xn)=[1,k(xn,x1),k(xn,x2),…,k(xn,xi),…,k(xn,xS)]。
若直接用最大似然法求w与δ2,会产生“过拟合”现象,可对w赋予均值为零、超参数为α的高斯先验分布。
(4)
式中α为S+1维的超参数向量,α=[α0,α1,…,αj,…,αS]T。
由马尔科夫性质知,对于测试输入矩阵x*,其对应预测值y*的概率表达式为
(5)
式中P(w,α,δ2|t)=P(w|t,α,δ2)P(α,δ2|t)。
由于P(α,δ2|t)∝P(t|α,δ2)P(α)P(δ2),其中“∝”表示成比例,则t的条件分布为
(6)
式中Ω为t的条件分布协方差,Ω=δ2I+φA-1φT,I为单位阵,对角阵A=diag(α0,α1,…,αj,…,αS)。
P(y*|t)等价形式为
(7)
式中αMP与是对w后验分布的最大似然估计。
求得后,RVM测试集的预测值y*和预测方差δ*2分别为
y*=μTφ(x*)
(8)
(9)
式中:μ为w的后验分布均值,μ=δ-2Q φTt;φ(x*)为测试样本组成的核矩阵;Q为w的后验分布协方差Q=(δ-2φTφ+A)-1。
基于RVM的煤自燃预测流程如图1所示。
图1 基于RVM的煤自燃预测流程
Fig.1 Prediction process of coal spontaneous combustion based on RVM
(1) 采集气体浓度与煤自燃温度。建立训练集(x,t)和测试集(x*,y*),其中x和x*分别为训练集和测试集的输入矩阵,输入数据集合元素属性包括C(O2),C(N2),C(CO),C(CO2),C(CH4)和O(CO/CO2),其中C(·)为气体浓度,O(a/b)为a,b两种气体浓度之比,Vmax为煤自燃预测温度,包括训练集的测量温度t和测试集的预测温度y*两部分。
(2) 对训练集的输入向量xi构造高斯核函数
(10)
式中:λ为高斯核宽度;xn与xi分别表示训练集中第n组和第i组输入向量。
构造核函数的目的是将训练集的输入矩阵x由低维空间映射到高维空间,以获得更好的训练效果。
(3) 初始化超参数α与噪声方差δ2,对α和δ2进行迭代。
(11)
(12)
式中:为超参数α的更新值;变量γj度量了由数据求得的对应权值参数wj的效果,γj=1-αjQj,j,Qj,j为Q中第j行第j列的元素;为噪声方差δ2的更新值。
(4) 达到迭代终止条件后,部分αj会趋于无穷大,对应的wi为0;其余的αj趋于有限值,对应的输入向量xj被称为相关向量。完成训练后,得到最佳的w和δ2。
(5) 取剩余部分气体浓度作为测试样本集合。测试集的输入向量的高斯核函数为
(13)
式中:为第m组测试集的输入向量(其元素属性与训练集输入向量一致),m=1,2,…,M,M是测试集样本数。
由高斯核函数构造高斯核矩阵,φ*是由核函数组成的核矩阵,即
(6) 将测试集数据和测试核矩阵代入由训练集确定的最优w和δ2的RVM模型中,即可得到煤自燃温度的预测值y*和预测方差δ*2。
通过模拟煤自燃实验,验证基于RVM的煤自燃预测方法的可行性与准确性。
陕西省长武县亭南煤矿采用综采放顶煤采煤工艺,在通风不良的环境下易发生煤自燃现象。为了有效预防煤自燃灾害的发生,创造与亭南煤矿相似的供氧与蓄热条件,检测该过程中煤自燃温度与指标气体浓度的变化。
利用XK型煤自燃实验平台进行实验,该平台由炉体、气路、控制及检测4个部分组成,如图2所示。炉体主体部分呈圆桶状,最大装煤高度为150 cm,内径为120 cm,总装煤量可达1.5 t;炉体周围的保温层与跟踪外层煤温的控温水层可保证炉内煤体处于良好的蓄热环境,水层中装电热管与进气预热紫铜管,在炉中心轴处设有取气管。炉体顶、底部均有气流缓冲层,使气流均匀通过煤体,空气经控温水层预热,创造与煤自燃温度相同的环境,然后从炉体底部送入。此外,炉内多处布置了测温探头和气体采样点。
图2 煤自燃实验台
Fig.2 Coal spontaneous combustion test bench
选用SP3430气相色谱仪对气体进行采集与分析,如图3所示。该气相色谱仪主要由双柱箱、自动取样机、色谱数据处理工作站组成。
图3 SP3430气相色谱仪
Fig.3 SP3430 gas chromatograph
通过SP3430气相色谱仪检测特征气体的成分及浓度,亭南煤矿的煤自燃样本数据见表1。选取其中30组样本数据为训练集,剩余8组样本数据为测试集。
表1 亭南煤矿的煤自燃样本数据
Table 1 Sample data of coal spontaneous combustion in Tingnan Coal Mine
序号C(O2)/%C(N2)/%C(CO)/%C(CO2)/%C(CH4)/%O(CO/CO2)Vmax/℃116.9679.910.080.410.307.3533.4211.0187.140.230.560.832.5134.1318.3579.930.060.440.1310.2935.6︙︙︙︙︙︙︙︙386.5288.221.508.280.014.99131.0
构建RBF神经网络、SVM、RVM 3种煤自燃预测模型。模型参数分别设置如下:RBF神经网络模型的扩展速度为371;SVM模型高斯核函数的核宽度为19,正则化系数为4 583;RVM模型核函数的核宽度为579。
基于RVM煤自燃预测模型的实施步骤如下。
(1) 初始化超参数向量α及方差δ2并设置最大迭代次数。
(2) 设置α的最大值,在RVM迭代过程中,当α超过该最大值时,便认为其趋向于无穷大,对应的w为0,则对该部分的值就不再更新;设置方差阈值,当其方差的相对误差小于阈值时,便认为达到训练要求,退出循环。
(3) 本实验训练数据经过323次迭代后,最终达到精度要求,此时有16个αj趋于有限值,wj不为0,得到RVM最优模型参数。
(4) 将测试样本代入已训练的模型中,预测采空区煤自燃温度值,并与测量值进行比较分析。
测试集真实温度值与3种方法的预测温度值对比结果如图4所示。基于RVM的煤自燃预测值在实际值附近上下波动,总体预测精度较高;基于SVM的煤自燃预测精度次之;基于RBF的煤自燃预测误差偏大,预测精度不理想。
图4 3种方法的预测结果
Fig.4 Prediction results of three methods
3种方法的相对误差如图5所示。3种方法的预测相对误差都在20%以内,基于RBF和SVM的煤自燃预测方法各有2个样本相对误差大于10%,基于RVM的煤自燃预测方法相对误差均小于10%,较为集中且相对较小。
图5 3种方法的预测相对误差
Fig.5 Prediction relative errors of three methods
3种方法的平均相对误差见表2。在3种煤自燃预测方法中,基于RBF和SVM的煤自燃预测方法训练误差较小,但测试误差较大,说明这2种方法存在严重的“过拟合”现象,泛化能力差。基于RVM的煤自燃预测方法的训练误差与测试误差比较接近且预测精度最高。由此可知,RVM对煤自燃温度预测的效果优于传统的基于RBF和SVM的煤自燃预测方法。
表2 3种方法的平均相对误差
Table 2 Average relative errors of three methods
煤自燃预测方法训练误差/%测试误差/%RBF2.448.46SVM2.917.90RVM6.085.48
通过模拟亭南煤矿煤样自燃过程的环境,检测并记录该过程中特征气体浓度值与煤自燃温度值。结合贝叶斯、极大似然估计等理论构建基于RVM的煤自燃预测模型,并与基于RBF神经网络和SVM的煤自燃预测模型进行比较。结果表明,传统的煤自燃温度预测方法存在“过拟合”现象,而基于RVM的煤自燃预测方法预测精度高,且具有预测误差小、泛化能力强、模型更稀疏等优点,更适合于对煤自燃等复杂非线性问题的预测。
[1] 金永飞,郭军,文虎,等.煤自燃高温贫氧氧化燃烧特性参数的实验研究[J].煤炭学报,2015,40(3):596-602.
JIN Yongfei,GUO Jun,WEN Hu,et al.Experimental study on the high temperature lean oxygen oxidation combustion characteristic parameters of coal spontaneous combustion[J].Journal of China Coal Society,2015,40(3):596-602.
[2] SUN Yong,WANG Shugang,WEI Lu,et al.Coal spontaneous combustion characteristics based on constant temperature difference guidance method[J].Process Safety and Environmental Protection,2019:224-227.
[3] 郝宇,叶正亮.不同甲烷气氛下煤自燃指标气体及活化能研究[J].工矿自动化,2019,45(11):65-69.
HAO Yu,YE Zhengliang.Research on index gas and activation energy of coal spontaneous combustion under different methane atmosphere[J].Industry and Mine Automation,2019,45(11):65-69.
[4] 周冬,刘贞堂,钱继发,等.采空区内煤自燃气体特征及产生规律分析[J].工矿自动化,2019,45(3):18-22.
ZHOU Dong,LIU Zhentang,QIAN Jifa,et al.Analysis of gas characteristics and generation rules of coal spontaneous combustion in goaf[J].Industry and Mine Automation,2019,45(3):18-22.
[5] 屈世甲,安世岗,武福生,等.大采高综采工作面采空区自燃“三带”研究[J].工矿自动化,2019,45(5):22-25.
QU Shijia,AN Shigang,WU Fusheng,et al.Research on spontaneous combustion "three zones" in goaf of fully mechanized working face with large mining height[J].Industry and Mine Automation,2019,45(5):22-25.
[6] PAN Ke,QIN Huali,SHI Jianyun.Application of smell analysis technology based on RBF neural network in fire detection[C]//Proceedings of 2006(Shengyang) International Symposium on Safety Science and Technology,Shengyang,2006:392-397.
[7] 邓军,周少柳,马砺,等.基于PCA-PSOSVM的煤自燃程度预测研究[J].矿业安全与环保,2016,43(5):27-31.
DENG Jun,ZHOU Shaoliu,MA Li,et al. Research on prediction method of coal spontaneous combustion degree based on PCA-PSOSVM[J].Mining Safety & Environmental Protection,2016,43(5):27-31.
[8] NURCIHAN C.Application of support vector machines and relevance vector machines in predicting uniaxial compressive strength of volcanic rocks[J].Journal of African Earth Sciences,2014:635-638.
[9] SOUNAK C,MALAY G,BANI K M.Bayesian nonlinear regression for large p small n problems[J].Journal of Multivariate Analysis,2012:29-30.
[10] 李海英,刘中银,宋建成,等.电力系统静态安全状态实时感知的相关向量机法[J].中国电机工程学报,2015,35(2):294-301.
LI Haiying,LIU Zhongyin,SONG Jiancheng,et al.Real-time static security situational awareness of power systems based on relevance vector machine[J].Proceedings of the CSEE,2015,35(2):294-301.
[11] WANG Xiuli,JIANG Bin,LU Ningyun.Adaptive relevant vector machine based RUL prediction under uncertain conditions[J].ISA Transactions,2018:217-224.
[12] 张龙,刘仁学.RVM算法在下肢辅助运动设备中的应用[J].信息与电脑(理论版),2019,31(4):51-54.
ZHANG Long,LIU Renxue.Application of RVM algorithm in lower limb assisted exercise equipment[J].China Computer & Communication,2019,31(4):51-54.
[13] 平善明,赵玲玲,苏小红.基于相关向量机和残差分析的短期风速预测[J].智能计算机与应用,2018,8(3):240-243.
PING Shanming,ZHAO Lingling,SU Xiaohong.Short-term wind speed forecasting method based on RVM and residual analysis[J].Intelligent Computer and Applications,2018,8(3):240-243.
LIU Bao,MU Kun,YE Fei,et al.Prediction method of coal spontaneous combustion based on relevance vector machine[J].Industry and Mine Automation,2020,46(9):104-108.