随着煤矿开采深度的增加,井下地质力学环境发生了显著变化,煤矿井下含煤地层特性,包括煤岩体岩性与结构特征等矿井支护工程与安全施工必需的基础参数愈显不足,施工时操作人员通常凭工作经验对岩层特性进行定性分析,工程设计的合理性与开采过程的安全保障受到很大影响。有效利用钻进参数信息实时识别钻头当前位置的地层岩性,从而得出煤矿巷道的地层信息,可以为巷道治理及后期维护提供可靠直观的地质依据,为同类矿井工程设计提供必要的基础地质参数[1-3]。
近些年来,国内外学者基于钻进参数对岩性识别进行了大量研究。S. S. Peng等[4]利用锚杆钻车在煤矿巷道顶板锚固过程中获取钻进参数,并通过趋势线方法对数据进行分析,得出了顶板岩石强度的识别结果。马峥等[5]提出了基于主成分分析(Principal Components Analysis, PCA)算法与模糊识别的岩性识别方法,并通过苏里格气田碳酸盐岩测井数据对该方法进行了验证。仲鸿儒等[6]基于自组织映射(Self-organizing Maps, SOM)和模糊识别相结合的岩性识别方法,采用自组织映射以无监督形式挖掘出6种测井参数的关系信息和拓扑结构。T.Singh等[7]分析比较了核模糊C均值聚类(Kernel Fuzzy C-Means Clustering, KFCM)算法的优缺点,并通过相关算例进行了测试。
上述研究在一定程度上能够实现地层岩性的识别,为地层识别基础理论的构建和工程应用提供了重要参考,但是较少考虑煤矿井下钻进施工所面临的复杂地层非结构化对象的作用,地层信息参数获取难度大;同时含煤地层的岩性特征通常与高维钻进参数有关,利用传统钻进参数进行岩性识别时存在精度低的问题,无法对复杂的含煤地层做出实时可信的描述。鉴此,本文利用高维钻进参数进行岩性识别,将PCA算法和KFCM算法结合起来,提出了一种基于PCA-KFCM算法的含煤地层岩性优化识别方法。以钻进试验台获得的钻进参数集作为识别数据来源,利用PCA-KFCM算法对钻进参数集进行降维和聚类处理,并采用马氏距离判别法对测试样本进行识别[8-10],为煤矿井下含煤地层岩性识别提供了一种新方法。
PCA算法的主要思想是对相关程度较强的p个指标进行线性变换并组合成新的综合指标,同时最大程度保持原有数据集的信息[11-14]。算法主要步骤如下:
(1) 数据标准化。使每个数据的均值为0,标准差为1,即标准化变量为
(1)
式中:αij为第i个数据的第j个指标,i=1,2,…,n,n为数据组的个数,j=1,2,…,N,N为数据的指标数量;μj为样本均值,为样本标准差,
(2) 计算各指标的相关系数,构造相关系数矩阵R(rij)n×N。
(2)
(3) 构造主成分。计算出相关系数矩阵R的特征值λ1,λ2,…,λN(λ1≥λ2≥…≥λN≥0)及其对应的特征向量μ1,μ2,…,μN,记μj=(μ1j,μ2j,…,μNj)T,做线性组合,得
yi=μ1ix1+μ2ix2+μjixj+…+μNixN
(3)
式中:yi为第i个主成分;xj为样本中第j个标准化变量。
(4) 选取主成分。计算特征值λj的贡献率bj和累计贡献率cp:
(4)
(5)
式中p为主成分的个数,p≤N。
选取使累计贡献率大于85%的前p个特征值作为主成分。
(5) 计算综合得分并进行评价。综合得分Z的计算公式为
(6)
通过对所有数据集的综合得分进行计算,完成对数据集的综合评价。
KFCM算法原理:对于给定的数据集X={x1,x2,…,xN},通过非线性映射φ将其映射到高维空间φ(X)={φ(x1),φ(x2),…,φ(xN)},利用核函数计算样本在高维空间中的内积,并应用最小化目标函数将数据集X分为k个聚类[15-17]。算法主要步骤如下:
(1) 设置分类的聚类个数k、模糊系数m、迭代截止误差ε和核函数参数。
(2) 对隶属度矩阵进行初始化,并且符合归一化规定。
(3) 计算聚类中心。聚类中心计算公式为
(7)
式中:vω为高维特征空间中第ω类的聚类中心,ω=1,2,…,k;μωj为第j个样本xj对第ω类的隶属度,μωj∈[0,1]。
为了实现目标函数最小化,可通过令其隶属度矩阵U的偏导数为零进行计算,则其解为
(8)
式中:d(φ(xr),vω)为高维空间中第r个样本φ(xr)与第ω个聚类中心的距离度量,xr为第r项数据集,r=1,2,…,N;vs为高维特征空间中第s类的聚类中心,s=1,2,…,k。
(4) 对隶属度矩阵U不断循环优化,依据矩阵范数进行对比,若收敛,则迭代停止,否则返回步骤(3)。
结合PCA算法的特征提取优势和KFCM算法具有较好聚类效果的特点,建立了基于PCA-KFCM算法的岩性识别模型,该模型首先利用PCA算法对高维数据集进行特征参数提取和数据降维处理,然后利用KFCM算法对主成分数据集进行聚类分析,最后通过马氏距离判断法建立判别准则,利用最小马氏距离完成对测试样本的地层岩性识别。岩性识别流程如图1所示。
图1 岩性识别流程
Fig.1 Lithology identification flow
(1) 利用钻进试验台获得机械钻速、回转扭矩、钻压、转速、回转压力和泥浆泵流量6种钻进敏感参数,去除误差较大和重复的数据,将所有有效的钻进参数利用配套软件导出,构造高维钻进参数集,包括训练样本和测试样本。
(2) 利用PCA算法对训练样本进行主成分分析,计算各数据集的相关系数,通过累计贡献率提取训练样本的特征值,其维数为p,此时应能够反映原来多种敏感钻进参数的信息,且不会产生过多的维度,并且能够保证所有主成分贡献率不会偏低。据此计算各主成分的特征向量,根据综合得分值对训练样本主成分数据集进行初步分类,然后利用KFCM算法对训练样本主成分数据集进行模糊核聚类,得到各分类的聚类中心及聚类类别数据集。
(3) 同样利用PCA算法对测试样本进行特征提取,获得测试样本主成分数据集,并通过马氏距离判别法建立判别准则(式(9)),消除变量间相关性影响,利用最小马氏距离完成所有测试样本的预测与判别[18-19]。
d(Xi,Gω)=min1≤ω≤kd(Xi,Gω),Xi∈Gω
(9)
式中:d为马氏距离;Xi为第i项测试样本;Gω为第ω项聚类类别数据集。
钻进试验台主要由主机、动力站及操作台、数据监测系统、泥浆泵等部分组成,如图2所示。主机采用门式框架结构,并集成液驱泥浆泵系统,系统最高压力为20 MPa,最大流量为104 L/min。系统可实时获得机械钻速、回转扭矩、钻压、转速、回转压力、泥浆泵流量6种钻进参数,作为研究的影响因素和识别数据来源[20-21]。
图2 钻进试验台组成
Fig.2 Compose of drilling test bench
试验岩样材料选用复合硅酸盐水泥、中砂和粉煤渣,按照一定的比例在自然温度、湿度条件下进行养护浇筑成型,主要依据岩样的单轴抗压强度进行分类,用于模拟含煤地层中的典型的软弱夹层、煤层和砂岩层3种岩层。共进行了40组试验,30组试验数据作为训练样本,10组试验数据作为测试样本。所得训练样本钻进参数集见表1。
表1 训练样本钻进参数集
Table 1 Data sets of drilling parameters for the training samples
序号机械钻速/(mm·s-1)回转扭矩/(N·m)钻压/MPa转速/(r·min-1)回转压力/MPa泥浆泵流量/(L·min-1)序号机械钻速/(mm·s-1)回转扭矩/(N·m)钻压/MPa转速/(r·min-1)回转压力/MPa泥浆泵流量/(L·min-1)1103.15726.78480.77061055.22520.11694.56086.77670.76341505.61519.8277.36926.78560.75211055.41219.517171.92876.11540.78341204.99520.7360.17516.87270.74551505.17519.41887.75436.13450.75431055.02519.64137.54446.69730.77761055.02520.31956.65356.60910.74011055.12519.3594.56156.60910.76351055.07519.92076.67546.76420.75041205.13219.56103.15836.78480.77131355.06520.12130.40546.59080.73151355.01519.0768.77156.87270.74951505.17519.42227.62146.57640.73111205.01518.9894.56236.69710.76491205.17519.923100.23326.75320.76941205.20520.09171.92946.60230.78541504.97520.824116.24316.82320.77321205.06020.21094.55766.75420.76011055.02519.72598.32156.72240.76781055.19520.01134.38656.69230.73211205.05519.12626.81456.54370.73091355.01518.91242.98226.78550.73431355.30519.22780.56446.45230.75871205.07519.61394.55916.84520.76211205.15519.82890.54346.72310.75981205.04519.614128.94826.88140.77531505.05520.22948.13546.79140.73651205.05519.21551.57936.62310.73871055.05519.33070.70436.82140.75011355.13519.5
为消除各参数量纲的影响,将所得训练样本数据集进行标准化,定义机械钻速、回转扭矩、钻压、转速、回转压力、泥浆泵流量的标准化变量分别为x1,x2,x3,x4,x5,x6,定义各主成分分别为y1,y2,y3,y4,y5,y6,通过PCA算法可计算出训练样本的相关系数矩阵,从而得出各主成分的贡献率和累计贡献率,见表2。
表2 主成分分析结果
Table 2 Principal component analysis result
主成分特征值差值贡献率/%累计贡献率/%y12.97601.413549.599349.5993y21.56250.706226.041275.6405y30.85630.288714.271089.9115y40.56750.54389.458899.3702y50.02370.00960.395299.7655y60.0141-0.2345100.0000
根据累计贡献率大于85%确定选取的主成分个数p为3,得出训练样本主成分的特征向量,见表3。
表3 主成分特征向量
Table 3 Principal component eigenvector
标准化变量y1y2y3x10.57540.02990.0229x2-0.10180.6410-0.0959x30.56880.1009-0.0703x4-0.01810.49680.8056x5-0.06680.5718-0.5798x60.57470.0658-0.0124
根据主成分特征向量的影响因子大于0.5的原则分析标准化变量的影响效果。从表3可看出,第1主成分主要反映了变量x1(机械钻速)、变量x3(钻压)和变量x6(泥浆泵流量)的数据信息;第2主成分主要反映了变量x2(回转扭矩)、变量x5(回转压力)的数据信息;第3主成分主要反映了变量x4(转速)和变量x5(回转压力)的数据信息,同时通过表3可以得到训练样本的主成分数据集。
通过式(6)进行综合计算,依据对每个评价对象计算出的综合得分Z值的大小进行排名,得到综合评价得分,见表4。
表4 综合评价得分
Table 4 Comprehensive evaluation score
排名序号得分排名序号得分192.2252163-0.04232141.50841730-0.07383171.41971810-0.0879440.90601927-0.2192560.89822020-0.27506240.8962212-0.37967160.85402218-0.65208230.57462312-0.7420910.48202429-0.94051080.34832519-1.051811130.31332615-1.126712250.28962721-1.19391370.09822811-1.24541450.02832926-1.320615280.02253022-1.5138
根据综合评价得分的离散度可以将训练样本主成分数据集大致分为3类:第1—7名为第1类,第8—21名为第2类,第22—30名为第3类。分类情况和试验岩样物理特性的分类保持一致,通过KFCM算法将训练样本主成分数据集进行模糊核聚类分析。在充分保留原钻进数据集信息的基础上,其维数由原来的6维降为3维,从而提高了岩性识别的准确率和运行效率。
接下来对训练样本主成分数据集进行聚类分析,目标函数为
(10)
式中:ursnew为迭代后的隶属度;ursold为迭代前的隶属度。
核函数选择高斯核函数,设置类别数为3,迭代截止误差ε为10-5,模糊系数m为2[22]。将30组训练样本主成分数据集代入式(7)、式(8),可以得出其聚类中心分别为v1=(0.511 9,0.103 1,-0.522 3),v2=(2.948 3,-0.269 6,0.859 8),v3=(-1.770 2,-0.042 6,0.399 6),对应试验岩样的软弱夹层、煤层和砂岩层3种岩性,并将对应数据集分为3组,此时该聚类中心可以作为岩性识别的基本参数。同时利用PCA算法对测试样本进行特征提取,得到测试样本主成分数据集,见表5。
表5 测试样本主成分数据集
Table 5 Principal component data sets of test samples
序号y1y2y31-2.2859-1.03001.67212-1.8263-2.0420-0.78753-0.92310.26140.142640.0151-0.8946-0.566150.86610.95720.694860.61490.78491.26987-0.6997-0.51680.211780.54100.6739-1.400792.62361.7279-0.5179101.07410.0779-0.7186
采用马氏距离判别法对测试样本进行判断,计算各测试样本分别到3组训练样本主成分数据集的马氏距离,根据最小马氏距离可识别各测试样本所属类别,同时测量各测试样本的平均单轴抗压强度,得到测试样本的材料属性,确定测试样本的实际岩性类别,与测试识别结果进行比较,识别结果见表6。
表6 测试样本预测结果
Table 6 Prediction result of test samples
序号聚类中心v1聚类中心v2聚类中心v3平均单轴抗压强度/MPa岩性识别判别结果115.09298.658128.745914.9煤层正确211.943212.724110.544221.5砂岩层正确326.10561.60555.758014.5煤层正确462.446110.89461.505021.3砂岩层正确5213.358611.45852.400820.9砂岩层正确6227.161811.64785.100121.3砂岩层正确739.20825.31765.150420.8砂岩层正确866.30886.60443.237121.1砂岩层正确9379.847929.46706.923721.2砂岩层正确100.728314.6638142.84503.9软弱夹层正确
从表6可看出,测试样本的岩性识别正确率为100%,验证了PCA-KFCM算法的有效性,实现了试验岩样岩性的正确识别。
为了说明基于PCA-KFCM算法的含煤地层岩性识别模型的优势,利用KFCM算法对表1中的钻进参数集进行训练和测试,各参数的取值均与PCA-KFCM算法的参数相同。首先对2种算法进行测试,选择相同的迭代截止误差,经计算可得PCA-KFCM算法需要迭代14步,训练样本与聚类中心距离和为73.951 5,KFCM算法需要迭代18步,训练样本与聚类中心距离和为90.067 4,2种算法的迭代误差如图3所示。
图3 2种算法迭代误差比较
Fig.3 Comparison of iterative errors of the two algorithms
从图3可看出,PCA-KFCM算法的聚类时间更短,当迭代次数较大时,优势更加明显,这说明PCA-KFCM算法的收敛速度明显快于KFCM算法,这是由于经过主成分特征提取后,降低了数据集的维数,数据计算量更小,复杂度更低,所以,数据处理时间更短。
同理,通过不同数量的训练样本对2种算法进行研究,并对测试样本进行识别,PCA-KFCM算法的识别正确率均为100%;当训练样本数量为21和22时,KFCM算法的识别正确率为90%,其余识别正确率为100%,2种算法的训练样本与聚类中心的距离和比较结果如图4所示。
图4 2种算法训练样本与聚类中心距离和比较
Fig.4 Comparison of distance sum between training samples and clustering centers of the two algorithms
从图4可看出,不同训练样本数量下PCA-KFCM算法的训练样本与聚类中心距离和更小,平均距离和比KFCM算法减小23.2%,即识别精度提高了23.2%,平均训练准确率更高,识别效果更好,当后期训练样本数据集增大时,该算法的适用性更好。
(1) 结合PCA和KFCM两种算法的优点,提出了基于PCA-KFCM算法的含煤地层岩性优化识别方法。首先利用PCA算法对训练样本进行特征提取并对样本进行训练,然后通过KFCM算法对训练样本主成分数据集进行模糊核聚类,最后采用马氏距离判别法对测试样本进行识别,通过钻进试验台获得的高维钻进参数集对算法进行了验证,实现了试验岩样岩性的正确识别。
(2) 与KFCM算法相比,PCA-KFCM算法的收敛速度明显快于KFCM算法,识别精度提高了23.2%,且大幅降低了计算量。
[1] 袁亮.我国深部煤与瓦斯共采战略思考[J].煤炭学报,2016,41(1):1-6.
YUAN Liang.Strategic thinking of simultaneous exploitation of coal and gas in deep mining[J].Journal of China Coal Society,2016,41(1):1-6.
[2] 蓝航,陈东科,毛德兵.我国煤矿深部开采现状及灾害防治分析[J].煤炭科学技术,2016,44(1):39-46.
LAN Hang,CHEN Dongke,MAO Debing.Current status of deep mining and disaster prevention in China[J].Coal Science and Technology,2016,44(1):39-46.
[3] 谭卓英,李文,岳鹏君,等.基于钻进参数的岩土地层结构识别技术与方法[J].岩土工程学报,2015,37(7):1328-1333.
TAN Zhuoying,LI Wen,YUE Pengjun,et al.Techniques and approaches for identification of geo-formation structure based on diamond drilling parameters[J].Chinese Journal of Geotechnical Engineering,2015,37(7):1328-1333.
[4] PENG S S,TANG D,SASAOKA T,et al.A method for quantitative void fracture detection and estimation of rock strength for underground mine roof[C]//Proceedings of 24th International Conference on Ground Control in Mining,2005:195-197.
[5] 马峥,张春雷,高世臣.主成分分析与模糊识别在岩性识别中的应用[J].岩性油气藏,2017,29(5):127-133.
MA Zheng,ZHANG Chunlei,GAO Shichen.Lithology identification based on principal component analysis and fuzzy recognition[J].Lithologic Reservoir,2017,29(5):127-133.
[6] 仲鸿儒,成育红,林孟雄,等.基于SOM和模糊识别的复杂碳酸盐岩岩性识别[J].岩性油气藏,2019,31(5):84-91.
ZHONG Hongru,CHENG Yuhong,LIN Mengxiong,et al.Lithology recognition of complex carbonate rocks based on SOM and fuzzy recognition[J].Lithologic Reservoir,2019,31(5):84-91.
[7] SINGH T,GOSAIN A.Comparison of different fuzzy clustering algorithms:a replicated case study[J].Advances in Intelligent Systems and Computing,2018,4(1):267-275.
[8] 莫树培,唐琎,汪郁,等.基于聚类和K近邻算法的井下人员定位算法[J].工矿自动化,2019,45(4):43-48.
MO Shupei,TANG Jin,WANG Yu,et al.Underground personnel positioning algorithm based on clustering and K-nearest neighbor algorithm[J].Industry and Mine Automation,2019,45(4):43-48.
[9] 熊印国.相对变换KFCM的变压器油击穿电压预测[J].控制工程,2018,25(11):2035-2040.
XIONG Yinguo.Prediction model of breakdown voltage for transformer oil based on relative transformation and KFCM[J].Control Engineering of China,2018,25(11):2035-2040.
[10] 董刚,马宏伟,南源桐,等.刮板输送机飘链故障诊断技术研究[J].煤炭科学技术,2017,45(5):41-46.
DONG Gang,MA Hongwei,NAN Yuantong,et al.Study on diagnosis technology of flying chain fault in scraper conveyor[J].Coal Science and Technology,2017,45(5):41-46.
[11] 宫凤强,鲁金涛.基于主成分分析与距离判别分析法的突水水源识别方法[J].采矿与安全工程学报,2014,31(2):236-242.
GONG Fengqiang,LU Jintao.Recognition method of mine water inrush sources based on the principal element analysis and distance discrimination analysis[J].Journal of Mining and Safety Engineering,2014,31(2):236-242.
[12] 彭秀艳,柴艳有,满新江.基于PCA-KFCM的船舶柴油机故障诊断[J].控制工程,2012,19(1):152-156.
PENG Xiuyan,CHAI Yanyou,MAN Xinjiang.Fault diagnosis of marine diesel engine based on PCA-KFCM[J].Control Engineering of China,2012,19(1):152-156.
[13] 李培,陈颖,马小平,等.基于PCA-ELM的煤矿突水预测方法研究[J].工矿自动化,2013,39(9):46-50.
Ll Pei,CHEN Ying,MA Xiaoping,et al.Research of coal mine water burst forecasting method based on PCA-ELM[J].Industry and Mine Automation,2013,39(9):46-50.
[14] 王健,冯健,韩志艳.基于流形学习的局部保持PCA算法在故障检测中的应用[J].控制与决策,2013,28(5):683-687.
WANG Jian,FENG Jian,HAN Zhiyan.Locally preserving PCA method based on manifold learning and its application in fault detection[J].Control and Decision,2013,28(5):683-687.
[15] 赵宝峰.基于MATLAB模糊聚类分析法治理矿井水害[J].煤炭科学技术,2013,41(7):89-92.
ZHAO Baofeng.Study on mine water disaster control based on MATLAB fuzzy clustering analysis method[J].Coal Science and Technology,2013,41(7):89-92.
[16] 王骏,刘欢,蒋亦樟,等.堆叠隐空间模糊C均值聚类算法[J].控制与决策,2016,31(9):1671-1677.
WANG Jun,LIU Huan,JIANG Yizhang,et al.Cascaded hidden space fuzzy C means clustering algorithm[J].Control and Decision,2016,31(9):1671-1677.
[17] 孔慧芳,朱翔.基于KFCM-MNN并联式混合动力汽车能量管理策略[J].合肥工业大学学报(自然科学版),2018,41(4):485-489.
KONG Huifang,ZHU Xiang.Energy management strategy for parallel hybrid electric vehicle based on KFCM-MNN[J].Journal of Hefei University of Technology(Natural Science),2018,41(4):485-489.
[18] 傅卫平,秦川,刘佳,等.基于SIFT算法的图像目标匹配与定位[J].仪器仪表学报,2011,32(1):163-169.
FU Weiping,QIN Chuan,LIU Jia,et al.Matching and location of image object based on SIFT algorithm[J].Chinese Journal of Scientific Instrument,2011,32(1):163-169.
[19] 王先甲,汪磊.基于马氏距离的改进型TOPSIS在供应商选择中的应用[J].控制与决策,2012,27(10):1566-1570.
WANG Xianjia,WANG Lei.Applications of TOPSIS improved based on Mahalanobis distance in supplier selection[J].Control and Decision,2012,27(10):1566-1570.
[20] 张幼振,张宁,邵俊杰,等.基于钻进参数聚类的含煤地层岩性模糊识别[J].煤炭学报,2019,44(8):2328-2335.
ZHANG Youzhen,ZHANG Ning,SHAO Junjie,et al.Fuzzy identification of coal-bearing strata lithology based on drilling parameter clustering[J].Journal of China Coal Society,2019,44(8):2328-2335.
[21] 张幼振,张宁,张献振.PDC锚杆钻头回转钻进的力学特性与试验[J].煤田地质与勘探,2019,47(2):207-211.
ZHANG Youzhen,ZHANG Ning,ZHANG Xianzhen.Mechanical characteristics and test of rotary drilling of PDC anchor bit[J].Coal Geology & Exploration,2019,47(2):207-211.
[22] 高新波,裴继红,谢维信.模糊c-均值聚类算法中加权指数m的研究[J].电子学报,2000,28(4):80-83.
GAO Xinbo,PEI Jihong,XIE Weixin.A study of weighting exponent m in a Fuzzy c-means algorithm[J].Acta Electronica Sinica,2000,28(4):80-83.
ZHANG Ning,ZHANG Youzhen,YAO Ke.An optimized identification method of coal-bearing stratum lithology[J].Industry and Mine Automation,2020,46(7):100-106.