A method for estimating the step size of underground personnel based on generative adversarial networks
-
摘要: 针对基于行人航位推算(PDR)的煤矿井下人员定位系统中步长估计存在累计误差及传统深度学习方法所需数据集样本过大的问题,提出了一种基于生成对抗网络(GAN)的井下人员步长估计方法。GAN模型主要包括生成模型和判别模型2个部分,均采用深度神经网络(DNNs)实现。生成模型根据输入数据生成连续的结果分布(即标签),其输出层使用线性激活函数,以保留网络的线性特性,允许模型预测任何人员在行走过程中的步长;判别模型根据输入数据与标签判别是真实标签还是由生成器生成的标签,其输出层使用Sigmoid激活函数,以实现结果的二分类。确定生成模型与判别模型后,GAN模型联合2个模型进行训练,通过构建并优化生成器和判别器之间的动态竞争,使得生成器能够在不断迭代中学会生成更加逼真、难以区分的数据样本。实验结果表明,使用同样训练集及测试集的情况下,GAN模型的平均误差为0.14 m,标准差和均方根误差均小于DNNs模型,最小值均为0.74 m。户外测试结果表明,基于GAN的井下人员步长估计方法在上下坡场景的误差最小值为3.21%,最大值为4.79%;相比于上下坡场景,操场场景的误差更小,最大误差为1.91%。Abstract: In response to the problems of cumulative errors in step size estimation and the large sample size required by traditional deep learning methods in the pedestrian dead reckoning (PDR) based underground personnel positioning system in coal mines, a step size estimation method for underground personnel based on generative adversarial network (GAN) is proposed. The GAN model mainly includes two parts: generative model and discriminative model, both of which are implemented using deep neural networks (DNNs). The generative model aims to generate continuous result distributions (i.e. labels) based on input data. Its output layer uses a linear activation function to preserve the linear features of the network, allowing the model to predict the step size of any personnel during walking. The discriminant model aims to distinguish whether the input data and labels are real labels or labels generated by the generator. Its output layer uses a Sigmoid activation function to achieve binary classification of results. After determining the generative model and discriminant model, the GAN model combines two models for training. By constructing and optimizing the dynamic competition between the generator and discriminator, the generator can learn to generate more realistic and indistinguishable data samples in continuous iterations. The experimental results show that under the same training and testing sets, the average error of the GAN model is 0.14 m, and the standard deviation and root mean square error are both smaller than those of the DNNs model, with the minimum values being 0.74 m. The outdoor test results show that the GAN based underground personnel step estimation method has a minimum error of 3.21% and a maximum error of 4.79% in uphill and downhill scenarios. Compared to uphill and downhill scenarios, the error in playground scenarios is smaller, with a maximum error of 1.91%.
-
0. 引言
目前常用的煤矿井下人员精确定位系统一般采用超宽带(Ultra Wide Band,UWB)测距手段,结合到达时间定位法(Time of Arrival,TOA)[1]或到达时间差法(Time Difference of Arrival,TDOA)实现定位。为了进一步提升煤矿井下人员精确定位系统的定位精度,以UWB定位为基础,结合其他传感器数据的多源定位方法逐渐成为研究热点。其中,以惯性测量单元(Inertial Measurement Unit,IMU)为基础的行人航位推算(Pedestrian Dead Reckoning,PDR)算法[2]具有环境敏感度低、不依赖外界信息等优势,十分适用于煤矿井下巷道环境,成为与UWB融合的常用算法。文献[3]提出了一种基于可变噪声方差卡尔曼滤波的UWB与PDR融合系统,既克服了PDR误差累计问题,又优化了UWB在非视距场景中的测距精度不足问题。除了与UWB融合外,PDR算法还有其他方向的应用,如文献[4]通过扩展卡尔曼滤波器将PDR与近超声定位融合,有效解决了非视距环境导致的近超声定位漂移问题。
在PDR算法中,步长估计的准确性直接影响其定位精度。步长估计方法主要分为2种[5-6],一种是使用加速度双积分的直接方法,另一种是使用行走模型或统计预测的间接方法。理论上双积分法具有更高的步长估计精度,然而由于IMU的噪声、偏差等问题,双积分法的误差累计极为严重。目前常用零速校正(Zero Velocity Updates,ZUPTs)[7]及其改进算法来减少误差累计,但是ZUPTs要求将IMU置于行人脚部,不适合实际应用。在间接方法方面,传统的方法有基于生物模型的步长估计方法[8-9]、基于经验关系的步长估计方法[10]等。除上述基于行走模型的方法外,利用机器学习的统计预测方法相关研究较多。文献[11]提出了一种在线自学习并实时更新步长的KFBPE算法,与近超声定位方法结合后实现了误差在25 cm以内的精确定位。此外,卷积神经网络[12-14](Convolutional Neural Network,CNN)、深度神经网络[15-16](Deep Neural Networks,DNNs)、循环神经网络[17](Recurrent Neural Network, RNN)、长短期记忆 [18-19](Long Short-Term Memory,LSTM)神经网络等也是常用的步长估计算法。
但是上述机器学习方法通常都需要采集大量训练数据,采集行人每一步的行走步长以进行准确标记,然后才能训练出合适的模型。一方面,由于模型需要适配不同行人不同步长特性,所以需要较多实验者参与数据采集。另一方面,目前步长获取方式一般采用IMU数据双积分与重校准,或使用高精度测速设备(如滚动测速传感器等),在计算过程中不可避免地会出现误差累计及精度不足问题。针对上述问题,本文提出了一种基于生成对抗网络(Generative Adversarial Network,GAN)的井下人员步长估计方法。该方法利用GAN特性,仅需少量训练数据即可建立较精确的步长估计模型,提高了井下PDR算法的定位精度。
1. 基于IMU的PDR算法原理
1.1 井下人员航位推算
IMU通常包含三轴加速度计和三轴陀螺仪。三轴加速度计用于检测用户在行人坐标系内独立的三轴加速度,实现行人步伐检测。三轴陀螺仪实时检测用户自身的角速度变化,实现行人行走方向推导。基于IMU的PDR算法如图1所示。IMU设备采集数据并进行坐标转换后,将加速度计数据与陀螺仪数据分别输入步伐检测器与航向角计算器中,再结合行人步长进行行人航位推算。
假设井下人员在$ k $ 时刻的真实坐标为$ {X}_{k}$,真实步长为$ {l}_{k} $,航向角为$ {\theta }_{k} $,添加符合零均值高斯分布的系统状态转移噪声$ {\sigma }_{{\mathrm{c}}}~N(0,{\sigma }_{{\mathrm{c}}}^{2}) $,则有
$$ {X}_{k}={X}_{k-1}+{l}_{k}\left[ \begin{array}{c}\mathrm{cos}\;{\theta }_{k}\\ \mathrm{sin}\;{\theta }_{k}\end{array} \right]+\left[ \begin{array}{c}{\sigma }_{{\mathrm{c}}}\\ {\sigma }_{{\mathrm{c}}}\end{array} \right] $$ (1) 井下人员运动模型如图2所示。在同一坐标系中,不断利用IMU获取井下人员运动数据,通过步伐检测、步长估计及航向角推算,实现井下人员位置推算。
1.2 井下人员步伐检测
在煤矿井下工作环境中,安装有IMU的矿卡、矿灯通常由工作人员佩戴在腰部,用腰带固定。当人员正常行走时,三轴加速度计数据呈现周期性变化,如图3所示。为了避免由于IMU佩戴时姿态问题导致数据歧义,将三轴加速度计数据整合为加速度幅值进行行人步伐检测。
由于重力影响,即使加速度计处于静止状态,依旧存在一个竖直向下的重力加速度。因此,用于行人步伐检测的加速度幅值为
$$ {\mathcal{A}}_{k}={\left({\mathcal{A}}_{x,k}^{2}+{\mathcal{A}}_{y,k}^{2}+{\mathcal{A}}_{z,k}^{2}\right)}^{\frac{1}{2}}-g $$ (2) 式中:$ {\mathcal{A}}_{k} $为k时刻加速度幅值,当加速度计处于静止状态时,$ {\mathcal{A}}_{k} $=0;$ {\mathcal{A}}_{x,k} $,$ {\mathcal{A}}_{y,k} $,$ {\mathcal{A}}_{z,k} $分别为k时刻x,y,z三轴加速度计读数;$ g $为重力加速度。
采用基于加速度幅值波峰检测的步伐检测算法。先进行带通滤波,使用巴特沃斯滤波器及简单移动平移法设置窗口长度,对窗口内加速度数值队列取平均值并进行滤波,去掉波形中噪声产生的毛刺,得到平滑效果更好的加速度幅值$ {\mathcal{A}}_{k}^{{\mathrm{F}}} $。再设定合适的加速度阈值$ \sigma $,与滤波后的加速度幅值$ {\mathcal{A}}_{k}^{{\mathrm{F}}} $进行对比,即可检测到井下人员的步伐。
基于加速度幅值波峰检测的步伐检测算法在实际应用中存在2个问题:① 加速度阈值因人而异。② 由于动作变化,可能带来一些异常值。针对第1个问题,首先设定一个经验阈值,再通过多次采集人员数据,进行动态调整,使得后续步伐检测更加准确。针对第2个问题,通过设置相邻2次迈步的时间差阈值,实现异常值剔除,从而得到更加准确的步伐检测结果。本文规定2次步伐的时间差应当保持在0.36~1.33 s,即人员步伐频率阈值为0.75~2.75 Hz。采样频率为100 Hz时步伐检测结果如图4所示。
1.3 基于四元数的井下人员航向角估计
井下人员定位导航中主要涉及三类坐标系统,分别为IMU坐标系、定位坐标系及大地坐标系,如图5所示。
井下人员航向角估计是将IMU坐标系中的IMU陀螺仪数据转换成其他2个坐标系数据的过程。本文采用四元数[20]转欧拉角[21]的方式实现航向角估计。欧拉角将三维旋转拆解为三维坐标系下的旋转,首先绕着IMU芯片的z轴进行旋转,得到偏航角w;再绕着IMU芯片的x轴进行旋转,得到翻滚角r;最后绕着IMU芯片的y轴旋转,得到俯仰角p。设一个四元数$ \boldsymbol{q}={\left[{q}_{0}\;{q}_{1}\;{q}_{2}\;{q}_{3}\right]}^{{\mathrm{T}}} $,其中$ {q}_{0} $为实部,$ {q}_{1}, {q}_{2},{q}_{3} $为虚部,则四元数与欧拉角的转换关系为
$$ w=\mathrm{arctan}\frac{2\left(q_1q_2+q_0q_3\right)}{q_0^2+q_1^2-q_2^2-q_3^2} $$ (3) $$ r=\mathrm{arctan}\frac{2\left(q_2q_3+q_0q_1\right)}{q_0^2-q_1^2-q_2^2+q_3^2} $$ (4) $$ p=\mathrm{arcsin}\left(2\left(q_0q_2-q_1q_3\right)\right) $$ (5) 2. 基于GAN的步长估计方法
设训练样本集$\varPhi=\left\{\left(a_i, b_i\right)\right\}_{i=1}^M $,$a_i $为经预处理后的加速度数据,$a_i \in {\bf{R}}^{(1 \times 150)} $,$b_i $为模型输出的估计步长,$b_i\in {\bf{R}} $,M为样本总数,则
$$ b=f(a,Z) $$ (6) 式中:b为bi的集合;$ f\left(\cdot\right) $为回归模型;a为ai的集合;Z为零均值高斯噪声,$ Z~ N\left(0,{\sigma }^{2}\right),{\sigma }^{2} $为方差。
GAN主要包括生成模型和判别模型2个部分,如图6所示。GAN通过生成模型与判别模型互相博弈学习,产生较为理想的输出。生成模型旨在根据输入数据生成连续的结果分布(即常说的标签)$ G(a,Z) $;判别模型旨在根据输入数据与标签给出概率$ D(a,b) $或者$ D(a,G(a,Z\left)\right) $,判别是真实标签还是由生成器生成的标签。
2.1 步长估计生成模型
采用DNNs实现步长估计生成模型,生成模型架构与参数如图7所示。模型输入为经过预处理的加速度数据$ a $及符合标准正态分布N(0,1)的随机噪声$ Z $。利用密集层处理输入数据,并进行降维和特征合并。使用4个全连接层完成步长预测回归任务,在每个全连接层的隐藏层中使用SeLU激活函数。SeLU激活函数能够解决神经网络训练中常见的梯度消失和梯度爆炸问题,有利于DNNs的稳定训练与优化。
采用LeCun正规初始化方法对每个隐藏层进行权重分配。LeCun正规初始化方法是一种适合于SeLU激活函数的权重初始化策略,可以确保在反向传播过程中激活函数的梯度保持在一个合适范围内,进一步提高网络训练的稳定性与效率。
输出层使用线性激活函数,以保留网络的线性特性,允许模型预测任何人员在行走过程中的步长。
2.2 步长估计判别模型
井下人员步长估计判别模型的输入数据包括真实加速度数据$ a $及对应的步长数据$ {{b}}^{\mathit{*}} $。$ {{b}}^{\mathit{*}} $既可以是训练集中采集到的真实人员步长$ b $,也可以是生成模型生成的仿造步长$ G(a,Z) $,即
$$ {{b}}^{\mathit{*}}\in \left\{b,G\left(b,Z\right)\right\} $$ (7) 判别模型架构与参数如图8所示,其参数与生成模型一致,但是,由于判别模型是用于判别当前输入的步长数据$ {{b}}^{\mathit{*}} $是否真实,即判别模型是一个二分类模型,所以其输出层使用Sigmoid激活函数,以实现结果的二分类。
2.3 GAN模型训练过程
确定生成模型与判别模型后,GAN模型联合2个模型进行训练,通过构建并优化生成器和判别器之间的动态竞争,使得生成器能够在不断迭代中学会生成更加逼真、难以区分的数据样本。
在训练过程中,判别器的损失反馈用于指导生成器的学习。当判别器判断样本的能力提高时,其反向传播的信号会指导生成器调整参数,以使生成的数据更加接近真实数据,更难以被判别器识别为假。
GAN训练过程可表示为
$$\begin{split} & \mathop{\mathrm{min}}\limits _{{\theta }_{{\mathrm{G}}}}\mathop{\mathrm{max}}\limits _{{\theta }_{{\mathrm{D}}}}V\left({\theta }_{{\mathrm{G}}},{\theta }_{{\mathrm{D}}}\right)={{E}}_{a,b\sim {p}_{{\mathrm{data}}}(a,b)}\left(\mathrm{lg}D\left(a,b\right)\right)+\\&\quad {{E}}_{a\sim {p}_{{\mathrm{data}}}\left(a,b\right),{\textit{Z}}\sim {p}_{{\textit{Z}}}\left({\textit{Z}}\right)}\left(\mathrm{lg}(1-D\left(a,G(a,{\textit{Z}}))\right)\right) \end{split} $$ (8) 式中:$ {\theta }_{{\mathrm{G}}} $与$ {\theta }_{{\mathrm{D}}} $分别为生成器与判别器的参数;V(·)为待优化函数;E(·)为标准值函数;$ p_{\mathrm{data}}\left(a,b\right) $为真实的数据分布,即加速度数据$ a $及测得的对应人员步长$ b $的联合分布;$ {p_{{{{{Z}}}}}\left({{{{Z}}}}\right)} $为先验噪声分布,用于生成随机噪声$ Z $。
式(8)中的$ E_{a,b\sim p_{\mathrm{data}}(a,b)}\left(\mathrm{lg}D\left(a,b\right)\right) $可有效促使判别器更加准确地实现数据判真。$ E_{a\sim p_{\mathrm{data}}\left(a,b\right),{{Z}}\sim p_Z\left({Z}\right)}(\mathrm{lg}(1- D\left(a,G(a,Z))\right)) $则提升判别器识别出由生成器产生的人员步长的能力。
3. 实验与结果分析
为验证算法性能,将测试集步长总和与实际行走距离进行对比。设第s次经过GAN回归的步长为$\hat{L}_s $,则经过GAN步长估计后的行走总距离为
$$ {D}_{{\mathrm{est}}}=\sum _{s=1}^{{N}_{s}}{\hat{L}}_{s} $$ (9) 式中$ {N}_{s} $为行走总步数。
3.1 GAN数据采集
实验场景如图9所示。实验人员将安装有IMU模块的设备放置于腰间,模拟真实井下人员姿态。共采集10名人员行走数据作为训练集,分别以慢速、正常速度及快速3种方式沿着直线行走指定距离$ {{}^{K}\mathcal{L}}_{I}^{V} $, I为实验人员编号,$ I=\mathrm{1,2},\cdots ,10 $;V为实验人员行走速率标志,$ V\in \{{\mathrm{S,N,F}}\} $,S表示慢速,N表示正常速度(中速),F表示快速;$ K $为第$ I $号实验人员在速率$ V $下的实验次数。实验人员在不同速率下分别进行5次独立实验并采集数据。对于测试集的采集,10名实验人员以随机行走速率沿着直线行走指定距离$ {{}^{K}\hat{\mathcal{L}}}_{I}^{{\mathrm{M}}} $,其中M表示实验人员实际行走方式为慢、中、快3种方式的随机混合。最终数据集见表1。
表 1 实验数据集Table 1. Experimental dataset数据集 行走速度 行走距离/m 采集次数 实际行走步数 训练集 慢速 20 50 1 639 中速 20 50 1 428 快速 20 50 1 104 测试集 混合 50 20 1 413 3.2 模型参数设置
生成模型与判别模型训练时各项超参数的数值选项见表2。进行模型训练时,局部调整各项参数,以获得最优性能。
表 2 生成模型与判别模型超参数数值选项Table 2. Hyperparameter numerical options for generative model and discriminant model超参数 数值选项 优化器 SGD, RMSprop, Adam 学习率$ \alpha $ $ {10}^{-4} $, $ {2\times 10}^{-4} $, $ {10}^{-3},{2\times 10}^{-3} $ 动量$ {\beta }_{1} $ 0.5, 0.9 衰变率$ \lambda $ $ {10}^{-4},{10}^{-3},{10}^{-2},0 $ 样本数量占比 $ \dfrac{1}{10},\dfrac{1}{5},\dfrac{1}{4},\dfrac{1}{3},\dfrac{1}{2},1 $ 不同学习率与不同衰变率下模型的均方根误差(Root Mean Square Error,RMSE)如图10所示。根据生成模型与判别模型学习率的不同,共设置16组实验。设$ \alpha ={10}^{-4} $,则16组实验中生成模型的学习率${\alpha }_{{\mathrm{G}}} $和判别模型的学习率${\alpha }_{{\mathrm{D}}} $分别为
$$\begin{split} {\alpha }_{{\mathrm{G}}}=&\{\alpha ,2\alpha ,10\alpha ,20\alpha , 2\alpha ,2\alpha ,2\alpha ,2\alpha , \\& 10\alpha ,10\alpha ,10\alpha ,10\alpha ,20\alpha ,20\alpha ,20\alpha ,20\alpha \} \end{split} $$ (10) $$\begin{split} {\alpha }_{{\mathrm{D}}}=&\{\alpha ,2\alpha ,10\alpha ,20\alpha ,\alpha ,2\alpha ,10\alpha ,20\alpha , \\& \alpha ,2\alpha ,10\alpha ,20\alpha ,\alpha ,2\alpha ,10\alpha ,20\alpha \} \end{split}$$ (11) 根据生成模型与判别模型衰变率的不同,共设置16组实验。设$ \lambda ={10}^{-4} $,则16组实验中生成模型的衰变率${\lambda }_{{\mathrm{G}}} $和判别模型的衰变率${\lambda }_{{\mathrm{D}}} $分别为
$$ \begin{split} {\lambda }_{{\mathrm{G}}}=&\{\mathrm{0,0},\mathrm{0,0},\lambda ,\lambda ,\lambda ,\lambda , 10\lambda ,10\lambda ,10\lambda ,10\lambda , \\&100\lambda ,100\lambda ,100\lambda ,100\lambda \} \end{split} $$ (12) $$ \begin{split} {\alpha }_{{\mathrm{D}}}=&\{0,\lambda ,10\lambda ,100\lambda , 0,\lambda ,10\lambda ,100\lambda , \\& 0,\lambda ,10\lambda ,100\lambda , 0,\lambda ,10\lambda ,100\lambda \} \end{split} $$ (13) 实验中各项超参数的默认值见表3。图10(a)所示16组实验中,第1组实验RMSE取得最小值,根据训练前设置的生成模型与判别模型学习率可知,当生成模型与判别模型的学习率设置为$ {\alpha }_{{\mathrm{G}}}={\alpha }_{{\mathrm{D}}}= {10}^{-4} $时,RMSE取得最小值。图10(b)所示16组实验中,第5组实验RMSE取得最小值,即当生成模型与判别模型的衰变率设置为$ {\lambda }_{{\mathrm{G}}}={10}^{-4},{\lambda }_{{\mathrm{D}}}=0 $时,RMSE取得最小值。
表 3 生成模型与判别模型超参数默认值Table 3. Default hyperparameters for generative model and discriminant model超参数 生成模型 判别模型 优化器 Adam Adam 学习率$ \alpha $ $ {10}^{-4} $ $ {10}^{-4} $ 动量$ {\beta }_{1} $ 0.5 0.5 衰变率$ \lambda $ $ {10}^{-4} $ $ {10}^{-4} $ 样本数量占比 $ \dfrac{1}{2} $ $ \dfrac{1}{2} $ 将生成模型与判别模型的学习率与衰变率设置为最优值,调整训练样本大小,结果如图11所示。可看出,当用于训练的样本数占总量的1/2时,RMSE取得最小值。
基于训练集样本训练的GAN模型超参数最优值见表4。
表 4 生成模型与判别模型超参数最优值Table 4. Optimal hyperparameters for generative model and discriminant model超参数 生成模型 判别模型 优化器 Adam Adam 学习率$ \alpha $ $ {10}^{-4} $ $ {10}^{-4} $ 动量$ {\beta }_{1} $ 0.5 0.5 衰变率$ \lambda $ $ {10}^{-4} $ $ 0 $ 样本数量占比 $ \dfrac{1}{2} $ $ \dfrac{1}{2} $ 3.3 算法性能对比
一次实验中的行走步伐与步长估计如图12所示。测试人员以正常步伐−大步前进−正常步伐的情况行走,共行走69步,总行走距离为50 m,行走距离通过激光测距仪进行测量。通过GAN模型和DNNs模型进行步长估计,并将步长进行累加,得到总行走距离分别为50.02,49.87 m。可看出GAN模型的误差小于DNNs模型。
以直线行走50 m,重复行走20次,对比GAN模型与普通DNNs模型性能,结果见表5。其中,STD为标准差,是描述数据点在均值周围聚集程度的指标。可看出,使用同样训练集及测试集的情况下,GAN模型的STD和RMSE均小于DNNs模型,最小值均为0.74 m。经计算,GAN模型的平均误差为0.14 m。
表 5 GAN模型与DNNs模型性能对比Table 5. Performance comparison of generative adversarial network model and deep neural networks model训练集数据量 模型 均值±STD/m RMSE/m 15 GAN 49.86±1.12 1.13 DNNs 50.06±1.49 1.49 30 GAN 49.83±0.99 1 DNNs 50.05±1.35 1.35 60 GAN 49.90±0.84 0.84 DNNs 50.12±1.28 1.29 120 GAN 49.89±0.76 0.77 DNNs 50.16±1.25 1.26 150 GAN 49.86±0.74 0.74 DNNs 50.15±1.23 1.24 3.4 户外场景算法性能测试
为了更好地验证本文算法的有效性,在户外场景进行2项实验:① 围绕操场行走1圈,测试行走距离。② 沿人行道上下坡,测试行走距离。
测试操场如图13所示。测试人员围绕黄色轮廓随意行走。黄色轮廓线总长358.48 m。共有2名测试人员参与测试,每位测试人员围绕操场行走5圈。
上下坡测试路线如图14所示。其中,黄线北侧端点海拔为5 m,黄线南侧端点海拔为14 m,测试路线总长212.35 m。共有2名测试人员参与测试,每位测试人员沿测试路线往返5次。
2个场地的步伐检测结果如图15所示,其中,操场场景共行走524步,上下坡场景往返1次共行走602步。上下坡场景中加速度中间一段静止表示测试人员转身的过程。
最终测试结果见表6。可看出,上下坡实验误差最小值为3.21%,最大值为4.79%;相比于上下坡场景,操场场景的误差更小,最大误差为1.91%。2个场景的误差均大于室内环境中沿直线行走的测试误差。主要原因如下:① 户外场景真实距离未知,实验数据取自航拍图并通过比例计算后绘制,真实距离大于估计距离,导致测试误差偏大。② 训练数据均取自室内平面环境,未采集上下坡数据,因此在户外测试中,上下坡场景误差大于操场场景。
4. 结论
1) 针对传统监督学习方法需要大量训练数据的问题,提出了一种基于GAN的井下人员步长估计方法,通过安装在井下人员腰部位置的惯性传感器估算人员行走距离。该方法包括 2个部分,一部分是负责井下人员步长回归任务的生成模型,另一部分是执行分类任务的判别模型。
2) 采用纵向对比和横向对比验证所提方法的性能。纵向上,通过调整不同的超参数并控制变量,获取最优性能超参数集合。横向上,与基于DNNs模型的步长估计算法进行对比,并给出平均值、STD及RMSE。
表 6 户外最终测试结果Table 6. Final outdoor test results场景 实验次数 GAN DNNs 人员1距离/m 人员1误差/% 人员2距离/m 人员2误差/% 人员1距离/m 人员1误差/% 人员2距离/m 人员2误差/% 操场 1 362.64 1.13 363.34 1.33 366.36 2.17 367.30 2.43 2 364.76 1.72 364.51 1.65 369.95 3.17 367.32 2.44 3 362.56 1.11 364.85 1.75 371.64 3.64 369.59 3.07 4 362.59 1.12 364.26 1.58 370.89 3.43 368.96 2.90 5 364.46 1.64 364.82 1.74 365.29 1.87 370.34 3.28 上下坡 1 440.56 3.74 440.74 3.78 443.30 4.38 447.32 5.33 2 439.19 3.41 442.13 4.10 449.99 5.95 442.66 4.23 3 438.18 3.17 439.39 3.46 442.76 4.25 445.99 5.01 4 444.00 4.54 442.89 4.28 444.81 4.74 442.80 4.26 5 439.19 3.41 441.56 3.97 444.21 4.59 442.88 4.28 3) 实验结果表明,使用同样训练集及测试集的情况下,GAN模型的平均误差为0.14 m,STD和RMSE均小于DNNs模型,最小值均为0.74 m。户外测试结果表明,基于GAN的井下人员步长估计方法在上下坡场景的误差最小值为3.21%,最大值为4.79%;相比于上下坡场景,操场场景的误差更小,最大误差为1.91%。
4) 基于GAN的井下人员步长估计方法一方面降低了训练模型时所需的数据集大小,另一方面提高了井下人员行走的步长估计精度。为了解决上下坡场景中精度下滑的问题,后续将针对上下坡场景采集更多数据并重新训练模型。
-
表 1 实验数据集
Table 1 Experimental dataset
数据集 行走速度 行走距离/m 采集次数 实际行走步数 训练集 慢速 20 50 1 639 中速 20 50 1 428 快速 20 50 1 104 测试集 混合 50 20 1 413 表 2 生成模型与判别模型超参数数值选项
Table 2 Hyperparameter numerical options for generative model and discriminant model
超参数 数值选项 优化器 SGD, RMSprop, Adam 学习率$ \alpha $ $ {10}^{-4} $, $ {2\times 10}^{-4} $, $ {10}^{-3},{2\times 10}^{-3} $ 动量$ {\beta }_{1} $ 0.5, 0.9 衰变率$ \lambda $ $ {10}^{-4},{10}^{-3},{10}^{-2},0 $ 样本数量占比 $ \dfrac{1}{10},\dfrac{1}{5},\dfrac{1}{4},\dfrac{1}{3},\dfrac{1}{2},1 $ 表 3 生成模型与判别模型超参数默认值
Table 3 Default hyperparameters for generative model and discriminant model
超参数 生成模型 判别模型 优化器 Adam Adam 学习率$ \alpha $ $ {10}^{-4} $ $ {10}^{-4} $ 动量$ {\beta }_{1} $ 0.5 0.5 衰变率$ \lambda $ $ {10}^{-4} $ $ {10}^{-4} $ 样本数量占比 $ \dfrac{1}{2} $ $ \dfrac{1}{2} $ 表 4 生成模型与判别模型超参数最优值
Table 4 Optimal hyperparameters for generative model and discriminant model
超参数 生成模型 判别模型 优化器 Adam Adam 学习率$ \alpha $ $ {10}^{-4} $ $ {10}^{-4} $ 动量$ {\beta }_{1} $ 0.5 0.5 衰变率$ \lambda $ $ {10}^{-4} $ $ 0 $ 样本数量占比 $ \dfrac{1}{2} $ $ \dfrac{1}{2} $ 表 5 GAN模型与DNNs模型性能对比
Table 5 Performance comparison of generative adversarial network model and deep neural networks model
训练集数据量 模型 均值±STD/m RMSE/m 15 GAN 49.86±1.12 1.13 DNNs 50.06±1.49 1.49 30 GAN 49.83±0.99 1 DNNs 50.05±1.35 1.35 60 GAN 49.90±0.84 0.84 DNNs 50.12±1.28 1.29 120 GAN 49.89±0.76 0.77 DNNs 50.16±1.25 1.26 150 GAN 49.86±0.74 0.74 DNNs 50.15±1.23 1.24 表 6 户外最终测试结果
Table 6 Final outdoor test results
场景 实验次数 GAN DNNs 人员1距离/m 人员1误差/% 人员2距离/m 人员2误差/% 人员1距离/m 人员1误差/% 人员2距离/m 人员2误差/% 操场 1 362.64 1.13 363.34 1.33 366.36 2.17 367.30 2.43 2 364.76 1.72 364.51 1.65 369.95 3.17 367.32 2.44 3 362.56 1.11 364.85 1.75 371.64 3.64 369.59 3.07 4 362.59 1.12 364.26 1.58 370.89 3.43 368.96 2.90 5 364.46 1.64 364.82 1.74 365.29 1.87 370.34 3.28 上下坡 1 440.56 3.74 440.74 3.78 443.30 4.38 447.32 5.33 2 439.19 3.41 442.13 4.10 449.99 5.95 442.66 4.23 3 438.18 3.17 439.39 3.46 442.76 4.25 445.99 5.01 4 444.00 4.54 442.89 4.28 444.81 4.74 442.80 4.26 5 439.19 3.41 441.56 3.97 444.21 4.59 442.88 4.28 -
[1] 包建军,霍振龙,徐炜,等. 一种高精度井下人员无线定位方法[J]. 工矿自动化,2009,35(10):18-21. BAO Jianjun,HUO Zhenlong,XU Wei,et al. A wireless location method with high precision for underground personnel tracking[J]. Industry and Mine Automation,2009,35(10):18-21.
[2] LEVI R W,JUDD T. Dead reckoning navigational system using accelerometer to measure foot impacts:US5583776[P]. 1996-12-10.
[3] GUO Shuli,ZHANG Yitong,GUI Xinzhe,et al. An improved PDR/UWB integrated system for indoor navigation applications[J]. IEEE Sensors Journal,2020,20(14):8046-8061. DOI: 10.1109/JSEN.2020.2981635
[4] WANG Hucheng,ZHANG Lei,WANG Zhi,et al. Pals:high-accuracy pedestrian localization with fusion of smartphone acoustics and PDR[EB/OL]. [2024-01-12]. https://ceur-ws.org/Vol-2498/short38.pdf.
[5] DÍEZ L E,BAHILLO A,OTEGUI J,et al. Step length estimation methods based on inertial sensors:a review[J]. IEEE Sensors Journal,2018,18(17):6908-6926. DOI: 10.1109/JSEN.2018.2857502
[6] VEZOČNIK M,JURIC M B. Average step length estimation models' evaluation using inertial sensors:a review[J]. IEEE Sensors Journal,2019,19(2):396-403. DOI: 10.1109/JSEN.2018.2878646
[7] KONE Y,ZHU Ni,RENAUDIN V. Zero velocity detection without motion pre-classification:uniform AI model for all pedestrian motions (UMAM)[J]. IEEE Sensors Journal,2022,22(6):5113-5121. DOI: 10.1109/JSEN.2021.3099860
[8] MIYAZAKI S. Long-term unrestrained measurement of stride length and walking velocity utilizing a piezoelectric gyroscope[J]. IEEE Transactions on Bio-Medical Engineering,1997,44(8):753-759. DOI: 10.1109/10.605434
[9] TJHAI C,O'KEEFE K. Step-size estimation using fusion of multiple wearable inertial sensors[C]. International Conference on Indoor Positioning and Indoor Navigation,Sapporo,2017:1-8.
[10] XIA Hao,ZUO Jinbo,LIU Shuo,et al. Indoor localization on smartphones using built-in sensors and map constraints[J]. IEEE Transactions on Instrumentation and Measurement,2019,68(4):1189-1198. DOI: 10.1109/TIM.2018.2863478
[11] WANG Hucheng,XUE Can,WANG Zhi,et al. Smartphone-based pedestrian NLOS positioning based on acoustics and IMU parameter estimation[J]. IEEE Sensors Journal,2022,22(23):23095-23108. DOI: 10.1109/JSEN.2022.3185248
[12] HANNINK J,KAUTZ T,PASLUOSTA C F,et al. Mobile stride length estimation with deep convolutional neural networks[J]. IEEE Journal of Biomedical and Health Informatics,2018,22(2):354-362. DOI: 10.1109/JBHI.2017.2679486
[13] SUI J D,CHANG T S. IMU based deep stride length estimation with self-supervised learning[J]. IEEE Sensors Journal,2021,21(6):7380-7387. DOI: 10.1109/JSEN.2021.3049523
[14] JIN H,KANG I,CHOI G,et al. Wearable sensor-based step length estimation during overground locomotion using a deep convolutional neural network[C]. Annual International Conference of the IEEE Engineering in Medicine and Biology Society,Mexico,2021:4897-4900.
[15] DÍAZ S,DISDIER S,LABRADOR M A. Step length and step width estimation using wearable sensors[C]. The 9th IEEE Annual Ubiquitous Computing,Electronics & Mobile Communication Conference,New York,2018:997-1001.
[16] HAN K,YU S M,KO S W,et al. Waveform-guide transformation of IMU measurements for smartphone-based localization[J]. IEEE Sensors Journal,2023,23(17):20379-20389. DOI: 10.1109/JSEN.2023.3298713
[17] 孙延鑫,毛善君,苏颖,等. 改进的井下人员定位PDR算法研究[J]. 工矿自动化,2021,47(1):43-48. SUN Yanxin,MAO Shanjun,SU Ying,et al. Research on improved PDR algorithm for underground personnel positioning[J]. Industry and Mine Automation,2021,47(1):43-48.
[18] WANG Qu,LUO Haiyong,YE Langlang,et al. Personalized stride-length estimation based on active online learning[J]. IEEE Internet of Things Journal,2020,7(6):4885-4897. DOI: 10.1109/JIOT.2020.2971318
[19] 郭倩倩,崔丽珍,杨勇,等. 基于LSTM个性化步长估计的井下人员精准定位PDR算法[J]. 工矿自动化,2022,48(1):33-39. GUO Qianqian,CUI Lizhen,YANG Yong,et al. PDR algorithm for precise positioning of underground personnel based on LSTM personalized step size estimation[J]. Industry and Mine Automation,2022,48(1):33-39.
[20] VOIGHT J. Quaternion algebras[M]. Berlin:Springer,2021.
[21] DIEBEL J. Representing attitude:euler angles,unit quaternions,and rotation vectors[J]. Matrix,2006,58(15):1-35.