A metadata standard construction method based on intelligent mine data classification and coding standards
-
摘要: 目前智能化矿山建设面临数据标准不健全、多源异构数据集成难度大、共享机制有待完善等问题。建立统一的智能化矿山元数据标准,对形成多源异构数据融合共享机制具有重要意义。基于智能化矿山数据分类与编码规范,研究了智能化矿山元数据标准构建方法,明确了元数据标准构建是对数据分类与编码的延伸研究与价值挖掘。定义了元数据实体与元数据属性的内涵,设计了包含基础描述框架与扩展描述框架的智能化矿山元数据描述框架,给出了反映智能化矿山业务场景特征的基础元数据属性描述项和智能化矿山数据分类与编码规范中基础类、生产类、安全类、管理类4大主题域组的拓展元数据属性描述项,从而构成元数据标准。以生产主题域组中采煤机惯导系统的惯导传感器为例,介绍了元数据标准的构建过程。基于智能化矿山数据分类与编码规范构建元数据标准,可以解决多源异构数据的融合与共享问题,促使矿山企业更加高效地管理、分析和应用数据,提高矿山数据治理的智能化水平。Abstract: Currently, the construction of intelligent mines is facing problems such as incomplete data standards, difficulty in integrating heterogeneous data from multiple sources, and the need to improve sharing mechanisms. Establishing a unified intelligent mine metadata standard is of great significance for forming a multi-source heterogeneous data fusion and sharing mechanism. Based on the intelligent mine data classification and coding standards, the construction method of intelligent mine metadata standards is studied. It is clarified that metadata standard construction is an extended research and value mining of data classification and coding. This paper defines the connotations of metadata entities and metadata attributes. This paper designs an intelligent mine metadata description framework that includes a basic description framework and an extended description framework. This paper provides basic metadata attribute description items that reflect the features of intelligent mine business scenarios, as well as extended metadata attribute description items for the four major thematic domain groups of basic, production, safety, and management in the intelligent mine data classification and coding standards, thus forming a metadata standard. Taking the inertial sensor of the shearer inertial navigation system in the production theme domain group as an example, the construction process of metadata standards is introduced. Building metadata standards based on intelligent mine data classification and coding standards can solve the problem of fusion and sharing of multi-source heterogeneous data, promote mine enterprises to manage, analyze, and apply data more efficiently, and improve the intelligence level of mine data governance.
-
表 1 元数据基本术语与定义
Table 1. Basic metadata terms and definitions
术语 定义 元数据实体 元数据的基本单元,是基于业务需求或逻辑相关性,由若干元数据属性组合而成的对象 元数据属性 描述数据项的各种属性或特性。属性提供了对数据更深层次解释的关键元素,包括数据的名称、定义、数据类型、约束等,帮助用户有效管理、理解和使用数据 表 2 安全类数据分类与编码示例
Table 2. Example of data classification and coding for safety category
层级 编码 名称 数据分级 说明 主题域分组 MJC 安全 — — 主题域 MJC01 顶板监测 — — 业务对象 MJC0105 锚杆(索)应
力监测— — 数据实体 MJC0105002 测点基本
信息— — 属性 MJC0105002001 测点编号 一般数据
2级— MJC0105002002 传感器类型 一般数据
2级液压枕式、光纤光栅式等 MJC0105002003 测点位置 一般数据
2级传感器所在巷道安装位置 MJC0105002004 报警值
(锚杆)一般数据
4级锚杆破断前最大值,kN或 MPa MJC0105002005 报警值
(锚索)一般数据
4级锚索破断前最大值,kN或 MPa MJC0105002006 测点安装
日期一般数据
2级— 表 3 智能化矿山元数据基础描述框架
Table 3. Basic framework for intelligent mining metadata description
描述项类别 描述项 标志信息 分类与编码 中文名称 英文名称 数据特征信息 定义 数据类型 值域 条件信息 最大出现次数 约束 表 4 智能化矿山元数据属性描述细则(部分)
Table 4. Partial detailed description of intelligent mine metadata attributes
元数据属性 描述 细则 分类与编码 唯一标志数据项的属性 应确保在整个系统或环境中是唯一的,以便准确定位和检索相关信息 中文名称 数据属性或数据实体的
中文标记元数据中文名称应唯一 英文名称 数据属性或数据实体的
英文名称用英文全称表示,所组成的复合词汇为无缝连写 定义 对数据属性或数据实体
含义的解释提供足够的信息,使用户能够理解元数据项的背景和上下文 数据类型 对数据属性有效值域的
规定及允许对该值域内
的值进行有效操作的规定为计算机能识别的基本数据类型 值域 数据属性所允许值的集合 根据数据类型与数据属性本身特点确定 最大出现次数 数据属性或数据实体在实际使用时可能重复出现的最大次数 只出现1次的表示为“1”,重复出现的表示为“N” 约束 某数据属性或数据实体是否应当总在元数据中选用或有时选用的说明 M为必选,表明该数据属性或数据实体必须选择;C为一定条件下必选;O为可选 表 5 基础类元数据扩展描述框架
Table 5. Extension of metadata description framework for basic category
元数据属性 描述 细则 存储介质 用于存储数据的物理媒介或设备,包括各种类型的技术和介质 包括纸质文档、固态硬盘、光盘、云存储等 业务领域 数据在组织内所归属或所关联的特定业务范围或领域 包括证照信息、机构、地质条件、开采条件、灾害条件、 IT基础设施等 表 6 生产类元数据扩展描述框架
Table 6. Extension of metadata description framework for production category
元数据属性 描述 细则 运行状态 描述设备、系统、程序或其他实体在特定时间点下的操作和表现状况 使用清晰术语,如运行、
待机、报警、维护等电源与能源
消耗描述设备、系统或工艺在运行过程中所需要的电力供应和对能源的利用程度 使用标准度量单位,如kw·h,L/h等 运行日志 记录设备、系统、应用程序或其他实体在运行过程中所发生事件、状态和操作的文档或记录 包括时间戳、事件描述、报警、错误报告、用户操作等信息 表 7 安全类元数据扩展描述框架
Table 7. Extension of metadata description framework for safety category
元数据属性 描述 细则 数据更新
频率在一定时间内,特定数据集合中数据更新的次数或频率 使用国际标准频率单位Hz表示 数据格式 数据在存储或传输过程中的组织结构和排列方式 以标准格式表示,如JSON,CSV,XML,JPG,MP4等 表 8 管理类元数据扩展描述框架
Table 8. Extension of metadata description framework for management category
元数据属性 描述 细则 访问权限 对特定资源或信息进行访问的权力或授权 包括读写、执行、删除权限 责任主体 对特定任务、信息、活动或决策负有责任的个体、团队、部门或组织 用清晰术语表示,使用主体的中文名称表示 修改信息 记录数据的修改历史和变更信息 使用通用变更记录标准,包括修改时间与修改人,修改时间使用GB/T 7408—2005规定的YYYYMMDD格式表示年、月、日组合[22],修改人用其中文名表示 数据来源 数据产生或获取的具体渠道、途径、系统或实体 主要包括具体员工、部门、供应商、客户、财务报表等 数据是否
可变更数据是否可被修改的状态 使用通用标志,用“是”或“否”表示 分类编码 MJB0102005 中文名称 采煤机惯导系统惯导传感器 英文名称 inertialNavigationSensors 定义 一种用于测量和监测采煤机运动状态的传感器 数据类型 字符型 值域 自由文本 最大出现次数 1 约束 C 运行状态 运行 电源与能源消耗 200 kW·h 运行日志 20231111−214930参数异常 -
[1] 刘峰,曹文君,张建明,等. 我国煤炭工业科技创新进展及“十四五”发展方向[J]. 煤炭学报,2021,46(1):1-15.LIU Feng,CAO Wenjun,ZHANG Jianming,et al. Current technological innovation and development direction of the 14th Five-Year Plan period in China coal industry[J]. Journal of China Coal Society,2021,46(1):1-15. [2] 王国法,杜毅博,徐亚军,等. 中国煤炭开采技术及装备50年发展与创新实践——纪念《煤炭科学技术》创刊50周年[J]. 煤炭科学技术,2023,51(1):1-18.WANG Guofa,DU Yibo,XU Yajun,et al. Development and innovation practice of China coal mining technology and equipment for 50 years:Commemorate the 50th anniversary of the publication of Coal Science and Technology[J]. Coal Science and Technology,2023,51(1):1-18. [3] 谭章禄,王美君. 智慧矿山数据治理概念内涵、发展目标与关键技术[J]. 工矿自动化,2022,48(5):6-14.TAN Zhanglu,WANG Meijun. Research on the concept connotation,development goal and key technologies of data governance for smart mine[J]. Journal of Mine Automation,2022,48(5):6-14. [4] 段欣宇. 面向物联网监控的煤矿设备异构数据集成与分布式存储研究[D]. 西安:西安科技大学,2021.DUAN Xinyu. Research on heterogeneous data integration and distributed storage of coal mine equipment for Internet of things monitoring[D]. Xi'an:Xi'an University of Science and Technology,2021. [5] 王国法,刘峰,孟祥军,等. 煤矿智能化(初级阶段)研究与实践[J]. 煤炭科学技术,2019,47(8):1-36.WANG Guofa,LIU Feng,MENG Xiangjun,et al. Research and practice on intelligent coal mine construction (primary stage)[J]. Coal Science and Technology,2019,47(8):1-36. [6] 王国法,任怀伟,赵国瑞,等. 煤矿智能化十大“痛点”解析及对策[J]. 工矿自动化,2021,47(6):1-11.WANG Guofa,REN Huaiwei,ZHAO Guorui,et al. Analysis and countermeasures of ten 'pain points' of intelligent coal mine[J]. Industry and Mine Automation,2021,47(6):1-11. [7] 王鹏,胡而已,徐金陵,等. 智能化矿山数据融合共享规范体系研究[J]. 中国煤炭,2022,48(6):19-27.WANG Peng,HU Eryi,XU Jinling,et al. Research on data fusion and sharing standard system of intelligent mine[J]. China Coal,2022,48(6):19-27. [8] 周琳. 面向智慧矿山的数据编码及元数据模型的研究[D]. 焦作:河南理工大学,2016.ZHOU Lin. The study of smart mine-oriented data encoding and metadata model[D]. Jiaozuo:Henan University of Science and Technology,2016. [9] 谭章禄,王美君,叶紫涵. 智能化煤矿数据治理体系与关键问题研究[J]. 工矿自动化,2023,49(5):22-29.TAN Zhanglu,WANG Meijun,YE Zihan. Research on intelligent coal mine data governance system and key issues[J]. Journal of Mine Automation,2023,49(5):22-29. [10] 杜毅博,赵国瑞,巩师鑫. 智能化煤矿大数据平台架构及数据处理关键技术研究[J]. 煤炭科学技术,2020,48(7):177-185.DU Yibo,ZHAO Guorui,GONG Shixin. Study on big data platform architecture of intelligent coal mine and key technologies of data processing[J]. Coal Science and Technology,2020,48(7):177-185. [11] 兰娟妮. 煤矿监管监察信息统一描述方法与模型设计[D]. 西安:西安科技大学,2021.LAN Juanni. The unified description method and model design of coal mine supervision and supervision information[D]. Xi'an:Xi'an University of Science and Technology,2021. [12] 李梅,邹学森,毛善君,等. 互联网+煤层气元数据管理系统关键技术研究[J]. 煤炭科学技术,2016,44(7):80-85.LI Mei,ZOU Xuesen,MAO Shanjun,et al. Study on key technology of Internet plus coalbed methane metadata management system[J]. Coal Science and Technology,2016,44(7):80-85. [13] KSSJ/BM11−2023 智能化矿山数据融合共享井工煤矿数据分类及编码规范[S].KSSJ/BM11-2023 Exploration of intelligent mine data fusion and sharing-classification and coding specification for coal mine data[S]. [14] 徐金陵,孙长春,樊九林,等. 智能化矿山数据分类与编码方法研究[J]. 中国煤炭,2023,49(11):1-9.XU Jinling,SUN Changchun,FAN Jiulin,et al. Research on data classification and coding method for intelligent mine[J]. China Coal,2023,49(11):1-9. [15] 罗婷婷,赵瑞雪,李娇,等. 面向多源异构科技信息治理的元数据标准规范体系构建[J]. 数字图书馆论坛,2021(4):58-67.LUO Tingting,ZHAO Ruixue,LI Jiao,et al. Construction of metadata standard system for multi-source and isomerized scientific and technological information governance[J]. Digital Library Forum,2021(4):58-67. [16] 李盼,翟军,陈燕. 基于Drupal的政府开放数据平台构建[J]. 现代情报,2016,36(8):37-43.LI Pan,ZHAI Jun,CHEN Yan. The construction of government open data platform based on drupal[J]. Journal of Modern Information,2016,36(8):37-43. [17] 王辉,邢伟,曹帅,等. 煤炭企业元数据采集与治理系统建设研究[J]. 中国标准化,2023(19):112-117.WANG Hui,XING Wei,CAO Shuai,et al. Research on the construction of metadata collection and governance system in coal enterprises[J]. China Standardization,2023(19):112-117. [18] 王辉, 邢伟, 曹帅, 等. 华阳集团企业级数据管理体系建设与应用实践研究[J]. 中国标准化,2023(22):121-127.WANG Hui, XING Wei, CAO Shuai, et al. Research on construction and application practice of enterprise data management system in Huayang Group[J]. China Standardization,2023(22):121-127. [19] 聂野,毛世红,张云军,等. 基于区块链技术的电子轮机日志系统[J]. 中国水运,2021(8):61-63.NIE Ye,MAO Shihong,ZHANG Yunjun,et al. Electronic engine log system based on blockchain technology[J]. China Water Transport,2021(8):61-63. [20] 陈运启,许金. 基于元数据与角色的煤矿综合信息管理系统权限控制模型设计与实现[J]. 工矿自动化,2014,40(11):22-25.CHEN Yunqi,XU Jin. Design of an access control model based on meta-data and role for integrated information management system of coal mine and its implementation[J]. Industry and Mine Automation,2014,40(11):22-25. [21] 邱春艳,陈可睿. 科学元数据标准的现状、特点与改进建议[J]. 数字图书馆论坛,2022(12):10-18.QIU Chunyan,CHEN Kerui. The status,characteristics and suggestions for improvement of scientific metadata standards[J]. Digital Library Forum,2022(12):10-18. [22] GB/T 7408—2005 数据元和交换格式 信息交换 日期和时间表示法[S].GB/T 7408-2005 Data elements and interchange formats–information interchange-representation of dates and times[S].