我国是一个以煤炭为主要能源的国家,随着煤炭资源的不断开采,煤自燃灾害时有发生,严重影响着煤矿安全生产,成为煤矿生产面临的主要灾害之一[1-3]。这不仅会造成煤炭资源的浪费,还会威胁煤矿工作人员的生命安全。因此,预测煤自燃温度对于煤矿安全生产具有重要意义[4-5]。
常用的煤自燃预测方法有测温法[6]、气体分析法[7]及磁力预测法[8]等。气体分析法因具有灵敏度高、可检测性强及规律性好等特性而被广泛使用[9],其通过测量煤与氧气发生化学反应时产生的指标性气体浓度并分析各气体浓度与煤自然发火之间的规律,实现对煤自燃温度的预测。然而,煤自燃温度与指标性气体浓度之间的关系是非线性的[10],准确描述这种非线性关系是进行煤自燃温度预测的关键。众多学者对气体分析法和煤自燃预测法之间的关联展开了研究。张天宇等[11]基于支持向量机(Support Vector Machine,SVM)分类算法和多种指标性气体构建了多煤种煤自燃危险性预测模型,得出由网格搜索法确定参数的模型分类准确率最高,但该模型确定参数的方法较为复杂。刘宝等[4]针对基于径向基神经网络方法和基于SVM方法等传统的机器学习方法存在误差较大的问题,提出了一种基于相关向量机的煤自燃温度预测方法,该方法使用的模型泛化能力强、预测误差小,但对参数选取的要求很高。文献[12-13]采用气体分析法和神经网络算法建立BP(Back Propagation,反向传播)神经网络预测模型,可以预测早期煤自燃情况,但该方法在测试时易出现过拟合现象。
随机森林(Random Forest,RF)算法具有预测精度高、不易过拟合、参数优化过程简单的优点[14-15]。鉴于此,本文利用煤自燃程序升温实验选取的O2浓度、CO浓度、C2H4浓度、CO/ΔO2比值、C2H4/C2H6比值作为煤自燃预警指标,构建了基于RF算法的煤自燃温度预测模型,引入均方误差值(Mean Square Error,MSE)和判定系数R2对模型参数进行优化。实验对比结果表明,与基于粒子群优化BP(Particle Swarm Optimization-Back Propagation,PSO-BP)神经网络算法和基于SVM算法的煤自燃模型相比,基于RF算法的煤自燃温度预测模型性能最好,预测精度最高,具有较高的准确率和鲁棒性,可为煤自燃温度预测及煤自燃火灾早期预防提供参考。
RF算法最早由L. Breiman[15]在2001年提出,它是以决策树为基础的一种机器学习算法,主要用于解决回归和分类问题。根据决策树的分裂标准主要有ID3、C4.5、CART等[16]决策树算法。当决策树的数量较多时,可以在一定程度上解决单一决策树过拟合、分类效果差等问题。RF算法具体流程如图1所示。
图1 RF算法流程
Fig.1 RF algorithm flow
(1) 利用Bootstrap随机有放回地从原始学习集抽取m个样本,一共进行N次抽样,形成N个学习样本子集。被抽中的样本称为袋内数据,未被抽中的数据则称为袋外数据。
(2) 对于N个学习样本子集,发展N个决策树;由于样本是随机选取的,各个决策树之间相互独立。
(3) 对于每一个决策树,假设共有M个特征属性,利用信息增益率选取一个最优属性作为该决策树的根节点,然后依次进行分裂。
(4) 每个决策树都按照最优特征进行分裂,在这个过程中不需要进行剪枝,形成随机森林。
(5) 按照每个决策树的回归结果,平均后得到最终结果。
基于RF算法的煤自燃温度预测模型构建流程如图2所示,模型基于Matlab环境实现。
图2 基于RF算法的煤自燃温度预测模型构建流程
Fig.2 Construction process of prediction model of coal
spontaneous combustion temperature based on RF algorithm
(1) 通过实验采集煤自燃预警指标气体浓度,分为学习集和测试集。
(2) 采用Bootstrap对学习集样本进行N次抽样,形成N个决策树;每个决策树按照最优特征进行分裂,形成随机森林。
(3) 采用均方误差值和判定系数R2对RF算法中的参数进行优化并确定RF模型参数。
(4) 将测试集样本指标气体浓度输入由学习集样本确定参数的RF模型,得到煤温预测结果。
通过采集山东邹城东滩煤矿煤样进行煤自燃程序升温实验。通过程序升温装置对煤体进行加热,然后通入均匀的气流,检测并记录煤氧复合反应的气体产物浓度和煤体温度,并进行特征温度分析,以此确定煤自燃预警指标。对该实验中的625组数据进行缺失值和归一化处理后得到521组数据,将这些数据按照2∶1的比例分为学习集和测试集。不同气体产物浓度与煤温之间的关系如图3所示。
(a) CO体积分数和C2H4体积分数与煤温的关系
(b) CO/ΔO2比值和C2H4/C2H6比值与煤温的关系
(c) O2体积分数与煤温的关系
图3 不同气体指标与煤温的关系
Fig.3 Relationship between different gas indexes and
coal temperature
从图3(a)可看出,CO在26.8 ℃开始产生,其浓度随着煤体温度升高而不断增大。煤温为50~100 ℃时,CO浓度增长速率较小,煤温高于100 ℃时,CO浓度增长速率明显增大,因此,CO浓度可以作为煤自燃早期预警指标[17-18]。C2H4在80 ℃开始出现,其浓度随煤体温度的增加逐渐增大,当煤体温度升至400 ℃时,其浓度达到最大值,具有很好的规律性,因此,C2H4浓度也可以作为煤自燃预警指标[19]。
从图3(b)可看出,随着煤体温度不断升高,C2H4/C2H6比值的变化趋势为先降低后升高再降低,CO/ΔO2比值的变化趋势为先增大后降低,C2H4/C2H6比值在150 ℃时出现极大值,同时CO/ΔO2比值增加速率变大,说明煤氧化反应会产生大量的C2H4气体和CO气体,这一特征能够和煤温变化规律对应,因此C2H4/C2H6比值和CO/ΔO2比值也可作为煤自燃预警指标。
从图3(c)可看出,随着煤体温度增加,O2浓度不断降低。O2浓度在50 ℃后迅速下降,而此时CO和C2H4浓度开始呈增大趋势,煤体温度升至150 ℃后,O2浓度降到最低,说明煤氧复合反应是阶段性的、非线性的。因此,O2浓度也可以作为煤自燃预警指标[20]。
综上所述,根据煤自燃程序升温实验,最终确定了煤自燃预警指标为CO浓度、O2浓度、CO/ΔO2比值、C2H4浓度及C2H4/C2H6比值。
在使用基于RF算法的煤自燃温度预测模型时,为了得到更准确的预测结果,需要对模型参数进行优化,寻找最优参数。基于RF算法的煤自燃温度预测模型需要优化的参数有n_estimators、oob_sore、max_depth、min_samples_split和min_samples_leaf。在该模型中,用于测试和学习的数据量较少,因此min_samples_split参数即决策树节点划分时使用的最小样本数量设为2,min_samples_leaf参数即叶子节点需要的最少样本数量设为1。为了保证样本选取的随机性,该模型采用oob误差估计法进行误差估计,即oob_sore参数是否使用袋外数据设置为true。n_estimators、max_depth参数优化如下。
2.2.1 n_estimators参数优化
n_estimators表示决策树的数量,如果决策树的数量过多,会导致模型计算量太大,决策树的数量太少,会影响预测结果的精准度,因此,必须找到最合适的决策树数量,使模型达到最优。
为了更好地对n_estimators参数进行优化,引入MSE对其进行分析。MSE越小,说明模型的精度越高。将n_estimators参数设置为0~200,不同深度下的决策树与MSE的关系如图4所示。
图4 决策树数量与MSE的关系
Fig.4 Relationship between the number of
decision trees and MSE
从图4可看出,不同决策树最大深度(max_deep)下,随着决策树数量的增加,MSE均不断降低,直至决策树的数量达到100后,MSE趋于平缓,变化较小。这说明决策树数量达到100后,模型达到了最高精度,不受其他因素影响。
为了验证上述决策树的数量是否为最优,本文引入判定系数R2进行再次验证。R2越大,说明预测值与真实值越接近,模拟的效果越好。本文将n_estimators参数设置为0~300,不同深度下的决策树数量与R2之间的关系如图5所示。
图5 决策树数量与R2之间的关系
Fig.5 Relationship between the number of
decision trees and R2
从图5可看出,在不同决策树最大深度(max_deep)下,随着决策树数量的增加,R2不断增大,直到决策树的数量达到100时,R2呈平缓趋势且数值达到最大。这说明模型的预测值不断接近真实值,拟合程度达到最理想状态。
综合考虑,基于RF算法的煤自燃温度预测模型的n_estimators参数设为100。
2.2.2 max_deep参数优化
max_deep参数表示限制决策树的最大深度,该模型输入样本数量较少,因此设max_deep参数为1~10,分析其对煤自燃温度预测模型性能的影响,如图6所示。
图6 决策树深度与R2的关系
Fig.6 Relationship between the depth of
decision tree and R2
从图6可看出,随着决策树的深度不断增加,R2呈现先增大后降低的趋势。当决策树的深度为4.5~5.5时,R2达到0.869 7,为其最大值,并保持不变,表示该模型拟合效果达到最好。
综上所述,基于RF算法的煤自燃温度预测模型的n_estimators参数设为100,max_deep参数的取值范围设为4.5~5.5。
为了对基于RF算法的煤自燃温度预测模型进行误差分析,本文选择了以下4项指标对模型进行评价。
(1) 平均绝对误差(Mean Absolute Error,MAE):
(1)
式中:fi为第i个样本的煤温预测值,℃,i=1,2,…,n,n为样本数量;yi为第i个样本的煤温真实值,℃。
式(1)中的差值被绝对化,可以很好地解决误差相互抵消的问题,从而可精准地评估模型的预测误差。MAE越小,说明该模型拟合误差越小。
(2) 平均绝对百分比误差(Mean Absolute Percentage Error,MAPE):
(2)
MAPE越小,说明模型的误差越小,模型预测精度越高,模型的拟合性能越好。
(3) 均方根误差(Root Mean Square Error,RMSE):
(3)
RMSE越小,说明模型的预测误差越小,模型的性能越好。
(4) 判定系数R2:
(4)
式中为测试样本煤温真实值的平均值,℃。
R2为模型的判定系数,取值为0~1,R2越接近1,说明模型的精度越高,即模型的性能越好。
为了验证基于RF算法的煤自燃温度预测模型预测的准确性,在保持与RF算法相同的学习集和测试集的基础上,引入了广泛采用的PSO-BP神经网络算法和SVM算法对煤自燃温度进行预测[21-22],并对其预测结果和基于RF算法的煤自燃温度预测模型预测的结果进行对比分析。
以上3种模型都有5个输入,1个输出。输入分别为CO浓度、C2H4浓度、O2浓度、CO/ΔO2比值、C2H4/C2H6比值,输出为温度。3种模型测试样本的煤温预测值和真实值如图7所示。
(a) RF模型测试样本的煤温真实值与预测值对比
(b) PSO-BP模型测试样本的煤温真实值与预测值对比
(c) SVM模型测试样本的煤温真实值与预测值对比
图7 3种模型测试样本的煤温真实值与预测值对比
Fig.7 Comparison of the real and predicted coal
temperature values of the test samples of the
three models
从图7可看出,基于RF算法的煤自燃温度预测模型重合度高于其他2个模型,这说明基于RF算法的煤自燃温度预测模型的性能最为优越。
不同模型预测性能指标对比见表1。从表1可看出,基于RF算法的煤自燃温度预测模型无论在训练过程还是在测试过程,其MAE、MAPE、RMSE以及R2指标均优于其他2个模型。而基于PSO-BP神经网络算法的煤自燃温度预测模型和基于SVM算法的煤自燃温度预测模型在测试阶段的MAE、MAPE、RMSE明显增大,R2明显减小,说明这2个模型在测试阶段出现了过拟合情况,导致模型的鲁棒性降低,预测结果精度下降。基于RF算法的煤自燃温度预测模型在学习阶段和测试阶段的4个指标并没有明显偏差,这说明该模型具有较强的泛化性及鲁棒性。
表1 不同模型预测性能指标对比
Table 1 Comparison of prediction performance indexes between different models
模型MAE/℃MAPE/%RMSER2训练测试训练测试训练测试训练测试RF9.569 411.764 90.080 40.078 914.319 120.930 10.914 00.869 7PSO-BP12.628 518.128 40.107 40.138 519.442 035.378 00.930 30.783 6SVM11.192 714.428 60.090 10.114 518.464 928.894 70.922 80.835 0
不同模型测试样本相对误差箱如图8所示,基于RF算法的煤自燃温度预测模型测试样本的最大相对误差为0.523 5,基于SVM算法的煤自燃温度预测模型的最大相对误差为1.052,基于PSO-BP神经网络算法的煤自燃温度预测模型的最大相对误差高达1.179 2。基于RF算法的煤自燃温度预测模型的预测结果误差要低于其他2个模型。
图8 不同模型测试样本相对误差箱
Fig.8 Relative error box diagram of test
samples for different models
(1) 结合气体分析法和RF算法构建了基于RF算法的煤自燃温度预测模型,并对模型参数进行了优化。与基于PSO-BP神经网络算法的煤自燃温度预测模型和基于SVM算法的煤自燃温度预测模型预测结果相比,基于RF算法的煤自燃温度预测模型精度最高,基于PSO-BP神经网络算法的煤自燃温度预测模型和基于SVM算法的煤自燃温度预测模型容易出现过拟合现象。
(2) 基于RF算法的煤自燃温度预测模型中,当决策树的数量达到100后,MSE和R2趋于稳定,且MSE达到最小,R2达到最大,说明模型所预测的温度与实际温度的误差最小,其相似度最大。
(3) 通过计算,RF测试阶段的R2为0.869 7,PSO-BP测试阶段的R2为0.783 6,SVM测试阶段的R2为0.835 0,说明基于RF算法的煤自燃温度预测模型能够较为准确地对煤自燃温度进行预测,具有较强的鲁棒性和普适性,相比其他预测模型,预测结果更为准确,且不需要复杂的参数优化。
[1] 王怡,谢军,任广意.采空区遗煤自然发火的指标气体研究[J].矿业研究与开发,2020,40(10):118-122.
WANG Yi,XIE Jun,REN Guangyi.Study on index gas in spontaneous combustion of goaf residual coal[J].Mining Research and Development,2020,40(10):118-122.
[2] 刘晨,谢军,辛林.煤自燃预测预报理论及技术研究综述[J].矿业安全与环保,2019,46(3):92-95.
LIU Chen,XIE Jun,XIN Lin.Review of theory and technology research on prediction of coal spontaneous combustion[J].Mining Safety & Environmental Protection,2019,46(3):92-95.
[3] 赵婧昱,张永利,邓军,等.影响煤自燃气体产物释放的主要活性官能团[J].工程科学学报,2020,42(9):1139-1148.
ZHAO Jingyu,ZHANG Yongli,DENG Jun,et al.Key functional groups affecting the release of gaseous products during spontaneous combustion of coal[J].Chinese Journal of Engineering,2020,42(9):1139-1148.
[4] 刘宝,穆坤,叶飞,等.基于相关向量机的煤自燃预测方法[J].工矿自动化,2020,46(9):104-108.
LIU Bao,MU Kun,YE Fei,et al.Prediction method of coal spontaneous combustion based on relevance vector machine[J].Industry and Mine Automation,2020,46(9):104-108.
[5] 邓军,肖旸,陈晓坤,等.矿井火灾多源信息融合预警方法的研究[J].采矿与安全工程学报,2011,28(4):638-643.
DENG Jun,XIAO Yang,CHEN Xiaokun,et al.Study on early warning method of multi-sourse information fusion for coal mine fire[J].Journal of Mining & Safety Engineering,2011,28(4):638-643.
[6] 朱红青,王海燕,王斐然,等.煤堆测温技术研究进展[J].煤炭科学技术,2014,42(1):50-54.
ZHU Hongqing,WANG Haiyan,WANG Feiran,et al.Research progress on coal stockpile temperature measuring technology [J].Coal Science and Technology,2014,42(1):50-54.
[7] 邓军,赵婧昱,张嬿妮.基于指标气体增长率分析法测定煤自燃特征温度[J].煤炭科学技术,2014,42(7):49-52.
DENG Jun,ZHAO Jingyu,ZHANG Yanni.Study on determination of coal spontaneous combustion characteristic temperature based on analysis method of index gas growth rate[J].Coal Science and Technology,2014,42(7):49-52.
[8] 陈欢,杨永亮.煤自燃预测技术研究现状[J].煤矿安全,2013,44(9):194-197.
CHEN Huan,YANG Yongliang.Research status of predicting coal spontaneous combustion[J].Safety in Coal Mines,2013,44(9):194-197.
[9] 王福生,王建涛,顾亮,等.基于灰靶决策模型的煤自燃程度判定方法[J].中国科技论文,2019,14(9):980-984.
WANG Fusheng,WANG Jiantao,GU Liang,et al.Determination method for coal spontaneous combustion degree based on grey target decision model[J].China Sciencepaper,2019,14(9):980-984.
[10] 邓军,雷昌奎,曹凯,等.煤自燃预测的支持向量回归方法[J].西安科技大学学报,2018,38(2):175-180.
DENG Jun,LEI Changkui,CAO Kai,et al.Support vector regression approach for predicting coal spontaneous combustion[J].Journal of Xi'an University of Science and Technology,2018,38(2):175-180.
[11] 张天宇,鲁义,施式亮,等.基于支持向量机分类算法的多煤种煤自燃危险性预测[J].湖南科技大学学报(自然科学版),2019,34(2):11-17.
ZHANG Tianyu,LU Yi,SHI Shiliang,et al.Prediction on coal spontaneous combustion risk for multi-coal based on SVM[J].Journal of Hunan University of Science & Technology(Natural Science Edition),2019,34(2):11-17.
[12] 昝军才,魏成才,蒋可娟,等.基于BP神经网络的煤自燃温度预测研究[J].煤炭工程,2019,51(10):113-117.
ZAN Juncai,WEI Chengcai,JIANG Kejuan,et al.Prediction of coal spontaneous combustion temperature based on BP neural network [J].Coal Engineering,2019,51(10):113-117.
[13] 张辛亥,孙久政,陈晓坤,等.基于指标气体的煤自燃预报人工神经网络专家系统研究[J].煤矿安全,2010,41(3):10-12.
ZHANG Xinhai,SUN Jiuzheng,CHEN Xiaokun,et al.Study on artificial neural network expert system for forecasting spontaneous combustion of coal based on gas indices[J].Safety in Coal Mines,2010,41(3):10-12.
[14] LEI Changkui,DENG Jun,CAO Kai,et al.A random forest approach for predicting coal spontaneous combustion[J].Fuel,2018,223:63-73.
[15] BREIMAN L.Random forests[J].Machine Learning,2001,45(1):5-32.
[16] 李永丽,王浩,金喜子.基于随机森林优化的自组织神经网络算法[J].吉林大学学报(理学版),2021,59(2):351-358.
LI Yongli,WANG Hao,JIN Xizi.Self-organizing neural network algorithm based on rangdom forest[J].Journal of Jilin University(Science Edition),2021,59(2):351-358.
[17] 石晶泰,任万兴,赵乾坤,等.基于多指标参数的煤自燃进程分析及应用[J].煤炭技术,2017,36(10):175-177.
SHI Jingtai,REN Wanxing,ZHAO Qiankun,et al.Analysis and application of coal spontaneous combustion based on multi-index parameters[J].Coal Technology,2017,36(10):175-177.
[18] 王月红,周宁,张九零,等.不同煤种自燃指标气体优化研究[J].河南理工大学学报(自然科学版),2020,39(6):10-15.
WANG Yuehong,ZHOU Ning,ZHANG Jiuling,et al.Study on gas optimization of spontaneous combustion index for different coal types[J].Journal of Henan Polytechnic University(Natural Science),2020,39(6):10-15.
[19] 赵婧昱,张宇轩,宋佳佳,等.高温贫氧下不同温度阶段煤体自燃指标气体测试[J].西安科技大学学报,2019,39(2):189-193.
ZHAO Jingyu,ZHANG Yuxuan,SONG Jiajia,et al.Coal spontaneous combustion indicator gases analysis of different temperature stages upon high-temperature and low-oxygen condition[J].Journal of Xi'an University of Science and Technology,2019,39(2):189-193.
[20] 疏义国,赵庆伟,郁亚楠.易自燃煤层预测预报气体指标体系研究[J].煤炭科学技术,2019,47(10):229-234.
SHU Yiguo,ZHAO Qingwei,YU Ya'nan.Research on prediction and forecast indicators system of easy spontaneous combustion coal seam[J].Coal Science and Technology,2019,47(10):229-234.
[21] XIAO Hongfei,TIAN Yunli.Prediction of mine coal layer spontaneous combustion danger based on genetic algorithm and BP neural networks[J].Procedia Engineering,2011,26:139-146.
[22] XIE Zhenhua,ZHANG Yu,JIN Cai.Prediction of coal spontaneous combustion in goaf based on the BP neural network[J].Procedia Engineering,2012,43:88-92.
ZHENG Xuezhao,LI Menghan,ZHANG Yanni,et al.Research on the prediction model of coal spontaneous combustion temperature based on random forest algorithm[J].Industry and Mine Automation,2021,47(5):58-64.