Research on the Data Center Oriented Equipment Support Data Integration Method
代冬升 DAI Dong-sheng;李雅峰 LI Ya-feng;赵晓文 ZHAO Xiao-wen;连云峰 LIAN Yun-feng
(32181部队,西安 710032)
(32181 Troops,Xi'an 710032,China)
摘要:数据集成是数据中心建设的重要内容和关键环节。针对装备保障数据中心功能定位,分析了装备保障数据集成需求及原则,建立了面向数据中心的装备保障数据集成框架及相关数据模型,分析了关键属性,设计了基本流程,并对数据集成成果在信息资源规划、数据仓库建设、数据共享交换、主数据管理等方面的应用进行了阐述。
Abstract: Data integration is an important part of data center construction. Against the functional positioning for equipment support data center, it analyzes the equipment support data integration requirements and principles. Then, it constructs the data center-oriented equipment support data integration framework and relational data models, analyzes its key properties and designs its basic procedure. And also, it explains the data integration results applications for information resources planning, data warehouse construction, data sharing exchange and main data management.
关键词:数据中心;数据集成;装备保障
Key words: data center;data integration;equipment support
中图分类号:TP311.52 文献标识码:A 文章编号:1006-4311(2019)23-0226-04
0 引言
随着信息技术的快速发展、装备保障业务需求的丰富拓展和信息化建设的逐步深入,数据中心建设成为深化装备保障信息服务需求、实现装备保障信息有效管理、强化装备保障信息综合运用的重要措施,是装备保障信息化建设的重要节点。装备保障数据中心功能的有效发挥,依赖于存储数据的高准确性、规范性、一致性和完整性,也对多源异构装备保障数据集成提出了更高要求。本文探讨了面向数据中心建设的数据集成方法,目的是实现高质量的数据集成,满足数据中心数据体系建设与应用需求。
1 装备保障数据中心数据集成概述
1.1 装备保障数据中心的功能定位
装备保障数据中心是以装备保障各类数据为核心,依托数据库管理、业务运行基础平台和网络系统,按照统一的标准,建立具有信息管理、数据综合分析、数据分类查询、综合统计分析及信息服务等功能的一体化装备保障数据管理体系[1]。单从数据角度来看,其主要功能应体现为:
①信息汇聚存储。数据中心是装备保障全系统、全寿命、全要素信息的大集中,基于相关数据标准规范,进行装备保障全方位信息的采集、处理、传输与存储,实现信息资源的大集中,为有效解决全局性、综合性问题奠定数据基础。
②保障决策支持。以装备保障决策重难点问题为牵引,对装备保障数据进行整合,通过数据挖掘、深度学习、大数据分析、可视化展示等技术手段,进行规律分析、模式提取、趋势研判、能力评估等,生成统计图表、指标数据、咨询报告等数据产品,为各级决策者提供决策支持。
③信息保障服务。面向装备管理、使用、维修、科研、生产等多类型用户,提供数据交换、信息检索、知识定制等服务以及交流互动平台,使各级保障人员能系统、精准、及时地获取解决问题所需的知识。
1.2 装备保障数据集成需求分析
数据中心是提供装备保障综合性数据服务的地方,数据来源广泛、体量庞大、类型多样,服务对象多元化明显。与传统意义上的数据集成相比,其特殊需求主要体现为[3,4]:
①数据全面性要求高。从作用发挥角度看,数据中心要汇聚装备保障领域的全部数据,才能提供系统、全面、综合的数据服务。装备保障数据中心的数据源包括全业务全寿命各业务信息系统数据、业务报表单据、网络情报信息、教材教案、数字化加工资源等,存在着多源异构、一致性差、标准化程度不高、数据冗余等常规问题,但数据源的数量非常庞大,涉及面非常广泛。
②数据标准化程度要求高。标准化是装备保障数据工程建设的基础和依据,决定了数据中心数据架构的规范性和稳定性,是数据中心长久稳定运行的重要保证。需要建立数据中心标准规范体系,指导和约束装备保障数据标准化处理,构建形成稳定的数据环境,以对外提供统一、标准和规范的数据支撑,满足多变业务应用的数据服务需求。
③数据集成工作量大。装备保障数据集成,需要大量收集、解析原始数据资源资料,搭建数据集成环境,在集成工具的辅助下,由多人协作共同完成数据集成工作。为确保数据集成各步骤准确无误,需同步采取有效措施进行数据集成过程管控,确保数据质量。
④需要建立数据间复杂的关联关系。数据中心中的数据间存在广泛的关联关系,如引用、计算、约束等,需要通过集成的方式建立众多来源数据之间的关联关系,使其成为一个有机整体,为深度开展数据挖掘、大数据分析奠定基础,以有效解决单一业务信息系统无法解决的全局性、综合性、复杂性问题。
1.3 装备保障数据集成原则
为满足数据中心数据体系建设与应用需求,装备保障数据集成应遵循以下原则:
①稳定性原则。数据集成中的数据结构一经确定就应保持相对稳定,否则数据结构的变化将导致数据值的联动变化,也就无法保证数据的稳定性和高质量。
②准确性原则。数据按照既定规则和策略集成处理后,应确保准确无误,否则将失去使用价值,并导致严重后果。
③齐备性原则。数据结构设计应科学合理,确保存储数据的完整性,以提供完整统一的用户视图,也为数据仓库提供充足的数据。
④一致性原则。应对信息代码、应用数据、关联关系等进行规范统一,实现数据的“一数一源”,保证数据的一致性。
⑤快速性原则。应采取有效措施手段确保集成的高效率,使得海量数据能够快速、准确集成整合入库。
2 装备保障数据集成模型设计
2.1 集成框架设计
面向数据中心的装备保障数据集成从数据模型和数据记录两方面开展集成工作,集成框架如图1所示。其中,数据源主要是指业务运行过程中使用的各种业务信息系统,提供数据集成对象;原样库是与业务信息系统数据库相一致的存储空间,业务信息系统数据库中的数据经过抽取后直接存储到原样库中;融合库用于存储经过整合、规范后的数据结构和数据记录,包括标准代码库、维度定义库、规范事务库和业务实体库的数据结构和数据记录。在融合库中,标准代码库用于存储经过规范统一的分类代码和标识代码;维度定义库用于存储数据分析的维度数据;规范事务库用于存储经过整合、规范、统一的装备保障事务数据;业务实体库用于存储按装备保障业务实体进行组织的实体数据。
上述数据集成框架中,原样库建设是在不改变业务信息系统数据及结构的基础上将其导入原样库,在物理上包括多个业务信息系统数据库及其数据,其目的是借助数据中心强大的数据存储和处理能力,为各业务信息系统技术人员进行单项业务运行数据处理提供支撑,同时为融合库建设奠定基础,避免直接操作业务信息系统数据造成破坏。融合库建设通过对各业务信息系统数据进行统一设计,实现相关数据逻辑上和物理上的统一,解决各业务信息系统数据标准不一带来的诸多问题。数据融合的结果可以用于信息资源规划、统一信息视图、数据仓库建设和数据交换等应用。
2.2 数据模型设计
2.2.1 原样库模型设计
原样库数据模型和数据记录以业务信息系统为单元进行组织,其组织结构如图2所示。
原样库需要忠实反映各业务信息系统数据库的实际,主要体现在:
①数据库类型和版本。原样库与各业务信息系统的数据库管理系统尽可能保持一致,包括数据库管理系统类型和版本。
②数据结构。原样库数据表和各业务信息系统数据表的数据结构应保持一致,包括表的组成、表名、数据项名称、中文全称、类型、精度、存储格式、关联关系等。
③数据记录。原样库数据记录和各业务信息系统数据记录应保持一致,可以暂不考虑数据记录的准确性问题。
2.2.2 融合库模型设计
融合库由标准代码库、维度定义库、规范事务库和业务实体库组成。融合库首先将原样库中的数据模型进行规范化设计,然后对数据模型的定义关系、数据记录的引用关系与发布关系进行明确,实现全局范围内各业务信息系统数据模型和数据记录的规范统一。
①标准代码库。标准代码库存储的标准代码包括分类代码和标识代码两部分,是在综合分析各业务信息系统代码基础上,通过合并、补充、新编等方式建立的统一的代码体系,用于实现各业务信息系统数据之间的集成关联。
②维度定义库。维度定义库提供统一的维度分类和维度表,为同类分析提供一致的视角。维度定义来源于标准代码库中的分类代码,如单位维度来源于标准代码库中的单位分类代码,装备维度来源于装备分类代码等。
③规范事务库。规范事务库用于存储原样库中的事务数据。规范事务库的数据字段的命名属性需要进行规范和统一,包括实体词、特性词、表示词、限定词等。同时,要同步更新使用标准代码库中的代码,并完成数据完整性验证。
④业务实体库。业务实体库用于存储以业务实体为单位建立的数据模型和数据记录,对应于业务数据中相对稳定、共享交换频率较高的基础性数据,如单位基本信息、装备基本信息、器材目录标准信息等。
2.2.3 模型关系描述
原样库与融合库各模型间的关系如图3所示。标准代码库数据模型来自于原样库数据模型,以业务信息系统中分类代码表和标识代码表为原型进行设计;维度定义库数据模型来自于标准代码库的分类代码表;规范事务库数据模型是在原样库数据模型的基础上,经过统一数据库类型、字段物理属性、字段命名属性等规范化处理后创建生成;业务实体库数据模型在规范事务库数据模型的基础上,经过数据项合并重组创建生成,且一旦建立就作为事务库数据模型的定义方,对事务库数据模型数据项进行定义。
2.3 关键属性分析
数据项的命名属性、关系属性和存储属性等对于装备保障数据集成的质量至关重要,是数据集成设计的重点之一。命名属性用于统一数据项名称,关系属性用于统一不同数据模型中数据项间的关联关系,存储属性用于统一数据项的物理存储属性。
①命名属性。命名属性是从语义角度对数据项进行分析和理解,主要包括数据项的名称、中文简称、中文全称、实体词、特性词、表示词、限定词,属于概念数据模型范畴。
②关系属性。关系属性是指数据项间存在的逻辑关系,主要包括定义关系、引用关系、发布关系和计算关系等,属于逻辑数据模型范畴。
③存储属性。存储属性是指数据项所具有的物理存储属性,主要包括数据项的数据类型、长度、格式等,属于物理数据模型范畴。
2.4 集成基本流程设计
业务数据集成主要包括数据源资料收集分析、原样库建设和融合库建设三个主要阶段。其中,资料收集分析阶段主要是收集现有业务信息系统相关的文档资料、数据库管理系统及相关信息,为数据集成的开展提供参考和依据;原样库建设阶段主要是建立与各业务信息系统尽可能相同的数据库环境,通过逆向分析,完成现有业务信息系统数据结构设计,并进行业务数据的抽取与存储;融合库建设阶段主要是在原样库建设基础上,进行标准代码库、维度定义库、规范事务库和业务实体库的数据模型设计,然后进行数据记录的抽取、清洗、转换等,并存储到相应的数据库中。业务数据集成的基本流程如图4所示。
3 装备保障数据集成典型应用
3.1 信息资源规划
信息资源规划是对装备保障领域信息的全面规划设计,能够构建形成稳定的数据环境,满足多变业务应用的数据需求。面向数据中心的装备保障数据集成,对已有业务信息系统进行了系统全面的梳理分析,对数据表、数据项、数据关系进行了详细的规范设计,建立了装备保障业务功能相关的主题模型、数据模型和统一的数据标准,在装备保障领域形成了稳定的数据结构和齐备的数据记录。该过程涵盖了信息资源规划的大部分工作,能够为装备保障数据体系建设、新研系统开发以及焦点应用的数据服务奠定坚实基础[5]。
3.2 数据仓库建设
面向数据中心的数据集成的主要目的之一,是为构建数据仓库提供优质数据源,支撑装备保障决策。一方面,业务数据集成融合了异构数据源的数据结构和数据记录,为数据仓库提供了统一的数据元素和数据记录;另一方面,维度定义库和用户事务库分别为数据仓库中的维度表和事实表提供了直接来源,可以直接使用相关成果,从而实现面向“管、修、供、训、战”等装备保障主题的数据仓库的快速构建,为KPI指标计算、多维数据分析、综合态势展现、数据深度挖掘等提供数据支撑[6]。
3.3 数据共享交换
面向数据中心的数据集成建立了统一规范的数据模型、数据标准和信息代码,以及相关数据内容间的对照映射关系,使得数据中心能够作为装备保障领域各业务信息系统间数据交换的枢纽,能够提供面向不同业务信息系统数据交换服务。一方面,避免了两两业务信息系统间建立繁琐的交换关系,以及数据在多个上下级系统间的级联传递,提升了交换速度、质量及效益;另一方面,通过数据中心的交换,只需要了解数据中心与业务信息系统间需要交换的那部分数据模型,整体架构易于维护和扩展,数据完整性可靠性易于保证[7]。
3.4 主数据管理
主数据是具有高业务价值的、可以在装备保障领域跨业务部门被重复使用的数据,例如装备基本信息、器材目录标准信息等。面向数据中心的数据集成对装备保障业务信息系统中的主数据进行了抽取整合,构建形成了标准代码库和业务实体库,并进行有效管理,还可以服务的方式把统一、完整、准确的主数据分发给装备保障领域内的操作型应用和分析型应用,包括业务系统、业务流程和决策支持系统等,从而保证装备保障关键数据在分散业务系统间的完整性、一致性[8]。
4 结束语
本文针对装备保障数据中心数据体系建设需求,提出了面向数据中心的数据集成方法,设计了数据集成框架、相关数据模型及集成基本流程。在实际开展数据中心建设过程中,依托数据中心的设施网络环境、存储计算资源和人员技术力量,应用该方法完成了多个业务信息系统数据的集成、整合、入库,在数据仓库建设、数据共享交换和主数据管理中发挥了重要作用。
参考文献:
[1]林小村,马玉林,翁小云.数据中心建设与运行管理[M].北京:科学出版社,2011:5.
[2]孟小峰,马如霞,马友忠等译.数据集成原理[M].北京:机械工业出版社,2014:201-204.
[3]徐永成.装备保障工程学[M].北京:国防工业出版社,2013:252-256.
[4]祝本玉,刘焱,朱洪波,高智宇.装备保障数据集成的认识与思考[J].装备学院学报,2015,26(5):91-94.
[5]高复先.信息资源规划[M].北京:清华大学出版社,2005:5.
[6]代冬升,谢峰,孙江生,梁伟杰.基于数据仓库的装备综合保障系统设计研究[J].装备环境工程,2014,11(6):163-166.
[7]滕晓燕,卢宇国,滕应杰.基于数据中心的企业生产数据集成模式初探[J].数字军工,2008(9):66-69.
[8]李萌,魏玮.基于SOA的主数据管理架构设计及实践[J]. 兵工自动化,2015,34(8):49-51. |