莫树培1,2,唐琎2,杜永万1,陈明1
(1.贵州工业职业技术学院 图书与信息中心, 贵州 贵阳 550008;2.中南大学 信息科学与工程学院, 湖南 长沙 410083)
摘要:针对基于传统BP神经网络的井下定位算法存在收敛速度慢、易形成局部极值、在煤矿井下强时变性电磁环境中定位误差大等问题,提出了一种基于模拟退火思想的粒子群优化算法加BP神经网络(SAPSO-BP)的井下自适应定位算法。采用SAPSO算法优化BP神经网络的初始权值和阈值,以加快训练收敛速度,使之到达全局最优;通过安装在井下巷道中的无线校准器采集目标点接收信号强度指示(RSSI)值,采用自适应动态校准方法对RSSI值进行实时校准,以减小强时变性电磁环境对定位精度的影响;最后利用SAPSO-BP神经网络估算出目标点位置坐标。实验结果表明,该算法的定位误差在2 m内的置信概率为77.54%,平均误差为1.53 m,定位性能优于未校准SAPSO-BP神经网络算法、PSO-BP神经网络算法、BP神经网络算法。
关键词:井下人员定位; 自适应定位; 模拟退火思想的粒子群优化算法; SAPSO-BP神经网络; 自适应动态校准
井下人员定位技术是保障煤矿安全生产的重要技术之一[1]。《煤矿安全规程》要求煤矿井下必须配备具有井下人员精确定位功能的系统[2]。目前,无线通信技术已逐渐成为国有大型煤矿移动通信系统的主流技术[3],利用RSSI(Received Signal Strength Indication,接收信号强度指示)进行井下人员定位[4],不需要增加额外设备,从而节约定位系统建造成本,因此,针对RSSI定位算法,学者们进行了大量研究工作,并提出了许多优化算法。基于RSSI的定位算法包括加权K近邻算法[5]、加权质心定位算法[6]和神经网络定位算法[7]等。优化算法中,石晓伟[8]提出一种改进质心算法,用BP(Back Propagation,反向传播)神经网络来拟合传统的距离损耗模型,再通过六点质心定位算法计算节点位置,但BP神经网络训练收敛速度较慢。张会清等[9]提出基于BP神经网络和泰勒级数的定位算法,使用BP神经网络模型估算距离,再利用泰勒级数展开算法确定目标点坐标位置,但未考虑BP神经网络权值优化问题。崔丽珍等[10]提出基于PSO-BP神经网络的定位算法,利用PSO(Particle Swarm Optimization, 粒子群优化)算法对BP神经网络各个神经元之间的权值进行寻优,但该算法在搜索全局最优时收敛速度慢,易陷入局部极小值。
针对上述问题,本文提出了一种基于SAPSO(Simulated Annealing and Particle Swarm Optimization,模拟退火思想的粒子群优化)-BP神经网络的井下自适应定位算法,利用SAPSO算法对BP神经网络的初始权值和阈值寻优,优化BP神经网络参数,提高运算效率,加快训练收敛速度,使之到达全局最优。此外,由于煤矿井下巷道空间狭小,各种电磁干扰严重,无线信号传输时会产生多径效应和阴影效应,影响定位精度,所以本文利用自适应动态校准方法对目标点的RSSI值进行实时校准,以减小强时变性电磁环境对定位精度的影响,使定位系统能自适应井下多变的电磁环境。实验结果表明,该定位算法平均定位误差为1.53 m,适用于井下特殊环境。
SAPSO-BP神经网络算法可以进行大范围数据融合,减少环境对计算的影响,提高神经网络运行效率,提升定位系统的稳定性和定位精度。
BP神经网络算法是一种利用误差反向传播训练的多层前馈型网络算法[11-12]。根据煤矿井下定位需求,建立BP神经网络模型,其结构如图1所示。
图1 BP神经网络模型结构
Fig.1 Structure of BP neural network
输入信号Rn为在样本点或目标点处利用终端设备扫描第n个AP(Access Point,接入点)获得的RSSI值;输出信号Ol(l=1,2)为样本点或目标点估算坐标(x,y);Zm为隐含层中的m个神经元;vnm为输入层到隐含层的连接权值;wml为隐含层到输出层的连接权值。
隐含层输出公式为
(1)
输出层输出公式为
(2)
激活函数选用双极性Sigmoid函数g(a):
(3)
BP神经网络采用下降梯度算法,网络学习过程收敛慢,当目标函数存在多个极值点时易陷入局部最优,且对初始权值、学习速度和动量因子等参数极为敏感。为解决上述问题,采用PSO算法对BP神经网络进行训练,优化BP神经网络参数。
PSO算法的基本思想是将鸟群中的每一只鸟抽象为没有体积和质量的粒子,粒子在空间中运动,只有速度和位置,由速度变量决定其方向和距离,粒子将追随当前最优粒子,并逐代搜索以得到最优解[13-14]。
假设由H个粒子组成的粒子群在D维空间飞行,空间的下限和上限分别为Ld,Ud,d=1,2,…,D。每个粒子的位置为其中为粒子h在t时刻第d维空间的位置,h=1,2,…,H。每个粒子的速度为其中为粒子h在t时刻第d维空间的速度;粒子速度最小值和最大值分别为vmin,vmax。个体最优值为其中为单个粒子在t时刻第d维空间的最优值。全局最优值为其中为整个粒子群在t时刻第d维空间的最优值。
粒子h在t+1时刻的速度更新为
(4)
式中:φ为惯性权重;c1和c2为学习因子;r1和r2为(0,1)区间的随机数。
粒子h在t+1时刻的位置更新为
(5)
当惯性权重较大时,有利于全局搜索;当惯性权重较小时,有利于局部搜索。φ的线性递减公式为
(6)
式中:φmax,φmin分别为惯性权重最大值和最小值;s为当前迭代次数;smax为最大迭代次数。
适应度函数为输出端的平方误差,可表示为
(7)
式中:为期望输出值;Ql为实际输出值;q为训练样本数。
PSO算法简洁、易实现,需要调整的参数不多,早期收敛速度快,但到后期受随机振荡现象影响,搜索全局最优时收敛速度慢,易陷入局部极小值。为解决上述问题,引入模拟退火的并行技术改善PSO算法性能,提高运算速度,使算法能从局部极小值区域跳出,最终达到全局最优解。
SAPSO算法的基本思想是将模拟退火思想引入PSO算法,在每个粒子的速度和位置更新过程中加入模拟退火机制,以一定概率接收恶化解。SAPSO算法可以从局部极值区域跳出,最终收敛到全局最优解[15-16]。
SAPSO-BP神经网络算法的基本思想是利用SAPSO算法对BP神经网络的权值和阈值进行优化,充分发挥SAPSO算法的全局寻优能力,提高BP神经网络的泛化能力,加快训练收敛速度,使之达到全局最优[17-19]。SAPSO-BP神经网络算法流程如下。
(1) 根据神经网络的结构,初始化网络权值和阈值,将输入层与隐含层的连接权值、隐含层与输出层的连接权值、隐含层和输出层的阈值映射到SAPSO算法中d维空间的初始全局最优值。
(2) 初始化粒子的位置、速度、个体最优值、惯性权重、学习因子、群的规模、起止温度、退火速度和最大迭代次数等。
(3) 随机生成H个粒子组成的种群,每个粒子的位置和速度分别为
(4) 用式(7)计算每个粒子的适应度值
(5) 检查适应度是否到达收敛精度、迭代次数是否达到最大迭代次数或温度是否达到终止温度,若不满足条件则进入下一步骤,否则跳转到步骤(9)。
(6) 将每个粒子的适应度值与个体最优值进行比较,取优更新个体最优值将每个粒子的适应度值与全局最优值进行比较,取优更新全局最优值
(7) 根据式(4)和式(5)更新每个粒子的位置和速度并对速度进行限制。
(8) 用式(7)计算每个粒子的适应度值并计算若Δf≤0,则接收新位置,跳转到步骤(4);若Δf>0,则计算接收概率exp(-Δf/tw),tw为当前退火温度;若exp(-Δf/tw)>ε(随机数ε∈[0,1]),则接收新位置,跳转到步骤(4);否则拒绝新位置,进行降温,令tw=βtw,β为退火速度,跳转到步骤(4)。
(9) 将SAPSO算法输出的最优解映射为BP神经网络的初始权值和阈值,用训练样本集训练BP神经网络,完成井下定位算法模型建立。
在煤矿井下特殊环境中,无线信息传输时会产生多径效应和阴影效应,导致采集的RSSI值产生误差,从而影响定位精度。为此,在井下安装无线校准器对目标点RSSI值进行校准。无线校准器主要用于扫描井下巷道固定点处的RSSI值,由主控芯片STC15W4K56S4、液晶显示模块LCD1602、无线芯片ESP8266EX和井下供电模块组成。
自适应动态校准方法的基本思想:通过安装在井下巷道中的W个无线校准器采集目标点在训练阶段和实时定位阶段的RSSI值,根据其变化量实时动态校准目标点RSSI值。
假设目标点在实时定位阶段的RSSI集合为Q={R1,R2,…,Rn},补偿后目标点的RSSI集合为则补偿公式为
(8)
式中:Rij为采集训练阶段第j个无线校准器接收的第i个AP的RSSI值;为实时定位阶段第j个无线校准器接收的第i个AP的RSSI值。
井下自适应定位算法分为采集训练阶段和实时定位阶段2个部分。
采集训练阶段利用无线接收设备采集训练样本和测试样本,为SAPSO-BP神经网络提供训练和测试数据,建立SAPSO-BP神经网络模型,具体流程如图2所示。
图2 采集训练流程
Fig.2 Flow of acquisition training
实时定位阶段通过无线接收设备采集目标点处的RSSI值,利用自适应动态校准方法对RSSI值进行实时动态校准,将校准过的RSSI值代入SAPSO-BP神经网络算法中,估算目标点位置坐标,具体流程如图3所示。
图3 实时定位流程
Fig.3 Flow of real-time positioning
实验环境为贵州某煤矿井下645 m运输巷,该巷道已覆盖工业以太网,截面宽度为4 m左右。在此基础上搭建井下定位系统,只需要安装交换机、AP终端和无线校准器。考虑到煤矿井下各类机电设备电磁干扰严重、杂物堆放、人员和设备移动等因素会改变巷道电磁环境,AP节点间距在90 m内可实现无线全覆盖,因此,在运输巷中安装8个AP终端,井下实验巷道如图4所示。
图4 井下实验巷道
Fig.4 Underground experimental roadway
由图4可知,在运输巷中安装的4个无线校准器可全面监测井下巷道电磁变化情况。
用于采集RSSI数据的无线接收设备由主控芯片STC15W4K56S4、液晶显示模块LCD1602、无线芯片ESP8266EX和锂电池供电模块组成。实验人员将无线接收设备佩戴在腰间,每个训练采样点采集20次RSSI数据,通过无线网络传输到服务器,服务器求出RSSI平均值,并与训练采样点的实际坐标组合后存放到数据库,组合方式为(Ri,1,Ri,2,…,Ri,n,xi,yi),Ri,n为第i个采集点扫描第n个AP获得的RSSI值,(xi,yi)为第i个采集点坐标。实际采样过程中,采样点间距基本控制在2~2.5 m,本次实验一共采集583个训练点,采集的数据存储到训练数据库。另外采集56次测试点数据,组成测试数据集并存储到测试数据库。在采集训练阶段,4个无线校准器也在采集数据,组成采集训练阶段校准数据集。
根据实验条件和数据采集情况,设置SAPSO-BP神经网络初始参数:输入层节点数为8(AP终端的个数),输出层节点数为2,隐含层神经元个数为13,学习速度η为0.1,动量因子α为0.25,粒子数H为60,学习因子c1和c2均为1.55,最大惯性权重φmax为0.95,最小惯性权重φmin为0.4,最大迭代次数Gmax为500,收敛精度设置为10-6。对SAPSO-BP神经网络进行训练,其结果如图5所示。
图5 SAPSO-BP神经网络训练结果
Fig.5 Training result of SAPSO-BP neural network
由图5可知,通过SAPSO算法对BP神经网络参数进行优化后,网络模型完全满足性能指标要求,证明了SAPSO-BP神经网络的可行性。
实时定位阶段,实验人员佩戴无线接收设备从起始位置(0,2 m)以2 m/s的速度做匀速运动,随机走到终点位置(645 m,1 m),无线接收设备每隔15 s采集一次数据。在试验区测试5个来回,共采集到105组有效数据,存储到在线定位数据库。同时,4个无线校准器也在采集数据,组成实时定位阶段校准数据集,为目标点的RSSI值实时动态校准提供数据支持。
对传统BP神经网络算法、PSO-BP神经网络算法、未校准RSSI值的SAPSO-BP神经网络算法和本文算法的定位性能进行比较,为保障不同算法建模效果,统一采用实验区域采集到的训练数据库和测试数据库进行训练和测试,定位性能对比如图6所示。
图6 4种算法的定位性能对比
Fig.6 Comparison of positioning performance of four algorithms
由图6可知,本文算法的定位误差在2 m内的置信概率为77.54%,高于未校准SAPSO-BP神经网络算法、PSO-BP神经网络算法和BP神经网络算法的68.18%、56.73%和45.39%。4种算法的定位误差统计结果对比见表1。
表1 4种算法的定位误差统计结果对比
Table 1 Comparison of statistical results of positioning error of four algorithms
由表1可知,本文算法的平均定位误差为1.53 m,低于其他算法。本文算法的定位精度比未校准SAPSO-BP神经网络算法提高了11.05%,比PSO-BP神经网络算法提高了18.62%,比BP神经网络算法提高了40.23%。
(1) 利用SAPSO算法优化BP神经网络模型参数,克服了传统BP神经网络算法易陷入局部最优的缺点,提高了BP神经网络算法收敛速度和学习能力。
(2) 利用自适应动态校准方法对目标点RSSI值进行校准,减小井下环境对定位的影响,使定位算法能自适应井下多变的电磁环境。
(3) 实验分析结果表明,本文算法的定位误差在2 m内的置信概率为77.54%,平均误差为1.53 m,性能优于未校准SAPSO-BP神经网络算法、PSO-BP神经网络算法、BP神经网络算法。
(4) 下一步的研究工作是利用克里金插值法对未采样点进行估算,将训练数据库中采样点间距减小到1 m内,增加指纹库的密度,从而在不增加设备和测试人员工作量的前提下,提高定位精度。
参考文献( References):
[1] 孙继平.煤矿信息化自动化新技术与发展[J].煤炭科学技术,2016,44(1):19-23.
SUN Jiping.New technology and development of mine informatization and automation[J].Coal Science and Technology,2016,44(1):19-23.
[2] 孙继平.2016年版《煤矿安全规程》监控与通信条款解析[J].工矿自动化,2016,42(5):1-8.
SUN Jiping.Explanations for part of monitoring and communication ofCoal Mine Safety Regulationsof 2016 Edition[J].Industry and Mine Automation,2016,42(5):1-8.
[3] 张立亚.全矿井融合通信系统研究[J].工矿自动化,2018,44(3):12-16.
ZHANG Liya.Research on mine integrated communication system[J].Industry and Mine Automation,2018,44(3):12-16.
[4] LIU Dawei, SHENG Bin, HOU Fen, et al. From wireless positioning to mobile positioning: an overview of recent advances[J]. IEEE Systems Journal,2014,8(4):1249-1259.
[5] FANG Xuming, JIANG Zonghua, NAN Lei, et a1. Optimal weighted K-nearest neighbor algorithm for wireless sensor network fingerprint location in noisy environment[J].IET Communications,2018,12(10): 1171-1177.
[6] 蒋锐,杨震.基于质心迭代估计的无线传感器网络节点定位算法[J].物理学报,2016,65(3):9-17.
JIANG Rui,YANG Zhen.An improved centroid localization algorithm based on iterative computation for wireless sensor network[J].Acta Physica Sinica,2016,65(3):9-17.
[7] 邹自明,何文斌,杨小平.基于LMBP神经网络的无线室内定位方法[J].桂林理工大学学报,2018,38(3):574-578.
ZOU Ziming,HE Wenbin,YANG Xiaoping.Wireless indoor positioning method based on LMBP neural network[J].Journal of Guilin University of Technology,2018,38(3):574-578.
[8] 石晓伟.基于BP神经网络和改进质心算法的室内无线定位技术的研究[D].北京:北京工业大学,2012.
[9] 张会清,石晓伟,邓贵华,等.基于BP神经网络和泰勒级数的室内定位算法研究[J].电子学报,2012,40(9):1876-1879.
ZHANG Huiqing,SHI Xiaowei, DENG Guihua,et al.Research on indoor location technology based on back propagation neural network and Taylor series[J].Acta Electronica Sinica,2012,40(9):1876-1879.
[10] 崔丽珍,许凡非,王巧利,等.基于PSO-BP神经网络的煤矿井下自适应定位算法[J].工矿自动化,2018,44(2):74-79.
CUI Lizhen,XU Fanfei,WANG Qiaoli,et al.Underground adaptive positioning algorithm based on PSO-BP neural network[J].Industry and Mine Automation,2018,44(2):74-79.
[11] ZHANG Yanjun, XU Jinrui, FU Xinghu, et a1. Hybrid algorithm combining genetic algorithm with back propagation neural network for extracting the characteristics of multi-peak Brillouin scattering spectrum[J]. Frontiers of Optoelectronics, 2017,10(1):62-69.
[12] 陈雯柏.人工神经网络原理与实践[M].西安:西安电子科技大学出版社,2016.
[13] XIONG Hailiang, PENG Meixuan, ZHU Kongfan, et a1.Efficient bias reduction approach of time-of-flight-based wireless localization networks in NLOS states[J]. IET Radar, Sonar & Navigation,2018,12(11):1353-1360.
[14] 张亚明,史浩山,陈客松,等.一种改进的无线传感器网络优化定位算法[J].电子科技大学学报,2015,44(3):357-362.
ZHANG Yaming,SHI Haoshan,CHEN Kesong,et al.An improved optimization localization algorithm in WSNs[J].Journal of University of Electronic Science and Technology of China,2015,44(3):357-362.
[15] 专祥涛.最优化方法基础[M].武汉:武汉大学出版社,2018.
[16] 宗群,秦新立,张博渊,等.基于DPSO-GT-SA算法的大规模UCAV协同任务分配[J].天津大学学报(自然科学与工程技术版),2018,51(10):1005-1014.
ZONG Qun,QIN Xinli,ZHANG Boyuan,et al.Cooperative task allocation of large-scale UCAV based on DPSO-GT-SA algorithm[J].Journal of Tianjin University(Science and Technology),2018,51(10):1005-1014.
[17] 张卿祎,王兴伟,黄敏.基于PSO和SA混合优化的智能容错QoS路由机制[J].东北大学学报(自然科学版),2017,38(3):325-330.
ZHANG Qingyi,WANG Xingwei,HUANG Min.An intelligent fault-tolerant QoS routing mechanism based on PSO and SA hybrid optimization[J].Journal of Northeastern University(Natural Science),2017,38(3):325-330.
[18] 姚建丽,胡红萍,白艳萍,等.应用SAPSO-BP神经网络的DOA估计方法[J].重庆理工大学学报(自然科学),2018,32(5):183-188.
YAO Jianli,HU Hongping,BAI Yanping,et al.DOA estimation method based on SAPSO-BP neural network[J].Journal of Chongqing University of Technology(Natural Science),2018,32(5):183-188.
[19] 刘海波,王和平,沈立顶.基于SAPSO优化灰色神经网络的空中目标威胁估计[J].西北工业大学学报,2016,34(1):25-32.
LIU Haibo,WANG Heping,SHEN Liding.Target threat assessment using SAPSO and grey neural network[J].Journal of Northwestern Polytechnical University,2016,34(1):25-32.
MO Shupei1,2,TANG Jin2,DU Yongwan1,CHEN Ming1
(1.Book and Information Center, Guizhou Industry Polytechnic College, Guiyang 550008, China;2.School of Information Science and Engineering, Central South University, Changsha 410083, China)
Abstract:In view of problems of slow convergence, easy to form local extremum and large positioning error in strong time-varying electromagnetic environment of underground positioning algorithms based on traditional BP neural network, an underground adaptive positioning algorithm based on simulated annealing and particle swarm optimization and BP neural network (SAPSO-BP) was proposed. SAPSO algorithm is used to optimize the initial weight and threshold of BP neural network to accelerate training convergence speed and make it reach the global optimum. The target point RSSI value is collected by wireless calibrator installed in underground roadway and real-time calibrated by adaptive dynamic calibration method, in order to reduce influence of time-varying electromagnetic environment on positioning accuracy. Finally, the SAPSO-BP neural network is used to estimate position coordinates of target point. The experimental results show that confidence probability of positioning error within 2 m of the proposed algorithm is 77.54%, average error is 1.53 m, the positioning performance is better than uncalibrated SAPSO-BP neural network algorithm, PSO-BP neural network algorithm and BP neural network algorithm.
Key words:underground personnel positioning; adaptive positioning; simulated annealing and particle swarm optimization algorithm; SAPSO-BP neural network; adaptive dynamic calibration
中图分类号:TD655.3
文献标志码:A
文章编号:1671-251X(2019)07-0080-06
DOI:10.13272/j.issn.1671-251x.2019010066
收稿日期:2019-01-16;修回日期:2019-06-06;
责任编辑:胡娴。
基金项目:贵州省科技厅资助项目(黔科合J字〔2014〕2082,黔科合LH字〔2016〕7069)。
作者简介:莫树培(1982-),男,布依族,贵州都匀人,副教授,硕士,主要研究方向为无线网络、传感器、模式识别与人工智能,E-mail:41851348@qq.com。
引用格式:莫树培,唐琎,杜永万,等.基于SAPSO-BP神经网络的井下自适应定位算法[J].工矿自动化,2019,45(7):80-85.
MO Shupei,TANG Jin,DU Yongwan,et al.Underground adaptive positioning algorithm based on SAPSO-BP neural network[J].Industry and Mine Automation,2019,45(7):80-85.