Coal mine gas emission prediction method based on random forest regressio
-
摘要: 为了提高煤矿瓦斯涌出量预测精度和效率,研究了基于随机森林回归的煤矿瓦斯涌出量预测方法。采用bootstrap自助法重采样技术采集训练样本数据,构建随机森林回归模型,取决策树输出值的均值作为煤矿瓦斯涌出量预测结果,利用袋外数据评价回归模型预测性能。通过计算袋外数据残差平方均值和拟合优度,确定随机森林回归模型的最优超参数;采用袋外数据残差平方均值的增加量来表征特征变量的重要性,用累计影响权重达到90%的部分特征变量代替煤矿瓦斯涌出量的全部特征变量,筛选出采煤高度、煤厚、煤层瓦斯含量、采出率、埋深、日进度、开采强度、邻近层间距8个重要程度高的特征变量作为模型的输入变量。测试结果表明,采用全部特征变量和部分特征变量的随机森林回归模型均具有较好的预测性能,进行特征变量选择后,模型的平均绝对误差由022 m3/min下降到021 m3/min,平均相对误差由355%下降到347%。基于特征变量选择的随机森林回归模型在保证较好的预测性能的前提下,降低了预测模型特征变量的维度,减少了原始数据获取工作,提高了预测效率。Abstract: In order to improve the prediction accuracy and efficiency of coal mine gas emission, a coal mine gas emission prediction method based on random forest regression is proposed. The bootstrap self-service resampling technology is used to collect training sample data and construct a random forest regression model. The mean value of the decision tree output value is taken as the prediction result of coal mine gas emission and the out-of-bag data is used to evaluate the prediction performance of the regression model. The optimal hyperparameters of the random forest regression model are determined by calculating the mean of squared residuals and goodness of fit of the out-of-bag data. The increase in the mean of squared residuals of the out-of-bag data is used to characterize the importance of the characteristic variables. All the characteristic variables of coal mine gas emission are replaced by some characteristic variables with cumulative influence weight of 90%. And eight characteristic variables with high importance are selected as input variables of the model, including coal mining height, coal thickness, coal seam gas content, recovery rate, burial depth, daily progress, mining intensity and adjacent layers spacing. The test results show that the random forest regression model with all characteristic variables and some characteristic variables has good prediction performance. After selecting characteristic variables, the average absolute error of the model decreases from 022 m3/min to 021 m3/min, and the average relative error decreases from 355% to 347%. The random forest regression model based on characteristic variable selection reduces the dimensionality of the characteristic variables of the prediction model, reduces the original data acquisition work, and improves the prediction efficiency under the premise of ensuring better prediction performance.
-
-
期刊类型引用(22)
1. 乔威豪,安葳鹏,赵雪菡,吕常周,崔嵩. 非均衡样本下基于GRA-BSMOTE-RF的瓦斯突出预测. 煤炭技术. 2024(02): 121-125 . 百度学术
2. 李伟伟. 大通煤矿3~#煤层瓦斯赋存特征及涌出量预测. 山东煤炭科技. 2024(02): 63-67+72 . 百度学术
3. 毛智强,徐耀松,王丹丹,田楚汉,黄明宇. 基于模态分解和时间卷积网络的瓦斯涌出量组合预测. 传感技术学报. 2024(10): 1795-1802 . 百度学术
4. 祁云,白晨浩,代连朋,汪伟,薛凯隆,崔欣超. 改进双向长短期记忆神经网络的瓦斯涌出量预测. 安全与环境学报. 2024(12): 4630-4637 . 百度学术
5. 胡青松,郑硕,李世银,孙彦景. 基于改进TCN-TimeGAN的矿井瓦斯浓度智能预测方法. 煤炭科学技术. 2024(S2): 321-330 . 百度学术
6. 张董极,肖琴. 基于复杂网络的风速预测新方法. 太阳能学报. 2023(03): 90-96 . 百度学术
7. 赵停停,杨世品,李丽娟,潘星宇,陈宇. 基于机理和数据驱动建立牛粪厌氧发酵产气预测混合模型. 生物质化学工程. 2023(03): 39-48 . 百度学术
8. 胡文博,孙延辉,马红林. 基于多因素的煤矿突水事故预测随机森林模型. 采矿技术. 2023(03): 117-120 . 百度学术
9. 马红林,胡文博,孙延辉. 矿井巷道摩擦阻力系数预测模型研究. 采矿技术. 2023(04): 239-243 . 百度学术
10. 张丹锋. 基于频率分解与LSTM网络模型的隧道施工期瓦斯浓度预测. 公路交通技术. 2023(05): 169-176 . 百度学术
11. 牛红培. 基于时间分析法的煤矿瓦斯涌出量预测研究. 煤炭技术. 2023(11): 148-151 . 百度学术
12. 张增辉,马文伟. 基于随机森林回归算法的回采工作面瓦斯涌出量预测. 工矿自动化. 2023(12): 33-39 . 本站查看
13. 刘莹,杨超宇. 基于多因素的LSTM瓦斯浓度预测模型. 中国安全生产科学技术. 2022(01): 108-113 . 百度学术
14. 姚明刚. 粗煤泥深度洗选回收工艺的优化设计. 煤炭与化工. 2022(02): 123-126 . 百度学术
15. 刘翔,谢涛,王训洪,易泽邦,何秋芝. 基于改进随机森林算法的岩石爆破块度预测. 矿业研究与开发. 2022(07): 25-29 . 百度学术
16. 程麒铭,陈垚,刘臻,唐颖辉,袁绍春. 基于随机森林-投影寻踪法的生物滞留系统多目标评价方法. 水资源与水工程学报. 2022(04): 85-90+96 . 百度学术
17. 吕富强,唐诗华,李灏杨,刘坤之. 基于随机森林算法的地表点云孔洞修补. 无线电工程. 2022(09): 1589-1593 . 百度学术
18. 陈杰,任金武,朱喜旺. 基于WPA-BP优化神经网络的瓦斯含量预测修正直接法测定的结果. 煤炭技术. 2022(09): 143-147 . 百度学术
19. 范京道,黄玉鑫,闫振国,李川,王春林,贺雁鹏. ARIMA-SVM组合模型驱动下的瓦斯浓度预测研究. 工矿自动化. 2022(09): 134-139 . 本站查看
20. 成小雨,周爱桃,郭焱振,程成,李德波. 基于随机森林与支持向量机的回采工作面瓦斯涌出量预测方法. 煤矿安全. 2022(10): 205-211 . 百度学术
21. 韩聪玲,刘克格,刘彦鹏. 非线性回归算法在飞机载荷标定试验中的应用. 工程与试验. 2022(04): 31-35 . 百度学术
22. 彭义春,张捷,覃左仕. 基于随机森林算法的职位薪资预测. 智能计算机与应用. 2021(10): 67-72 . 百度学术
其他类型引用(7)
计量
- 文章访问数: 142
- HTML全文浏览量: 18
- PDF下载量: 18
- 被引次数: 29