基于数据仓库的集装箱多式联运信息管理平台设计
2022-07-20重庆电子工程职业学院王玲
重庆电子工程职业学院 王玲
针对目前集装箱多式联运智能化和信息化发展的迫切需求,各组织之间信息沟通不畅的瓶颈,以物联网、数据仓库和大数据技术为依托,面向物流各相关方,构建一套开放、安全、可信的追踪监管、信息共享与应用服务平台。平台可为铁、公、水、航等不同承运载体、承运单位提供货物在途追踪监测数据与定制化应用服务,提高数据的一致性和运行效率,实现物流信息交换与共享,有效提升多式联运业务衔接效率。
现阶段,集装箱物流管理系统的应用已经较为广泛,且相对成熟。集装箱多式联运行业相关的部门或企业如航运、铁路、船运、代理、码头、仓储和物流中心等都建立了自身独立的信息管理系统。但是,不同行业和不同部门之间存在着信息化水平不一的情况,信息管理上还是较为原始的操作方法。随着时间的推移,数据信息内容逐渐增多,行业之间缺乏有效的信息协同和合作,导致不能充分利用数据信息,造成资源浪费的情况。
为了从容面对激烈的市场竞争,行业需要将信息管理系统平台化,将各个系统的行业信息等原始数据进行取样、整合、存储和建模,以图表形式提供集装箱多式联运分析、监测和监督等服务,对接其他系统,实现实时数据的交换与共享,提升信息管理与决策能力。
1 数据仓库的特性
数据仓库属于一种数据管理技术,主要面向数据的应用,提供了数据管理功能,能够管理完备的、及时的、准确的和可理解的业务信息,并把这种信息提交给授权的个人,使他们有效地做出决策,支持综合性的数据分析,尤其是对战略分析。数据仓库具有面向主题、管理大量信息、不同介质信息存储、跨越数据库模式和信息的概括和聚集等特征,还具有集成性、不可更新和随时间变化的特性。
数据仓库技术的应用能够为集装箱多式联运的可持续发展提供积极影响,能够根据决策者的不同需要,按照不同的应用主题对数据信息进行组织支持,从而将分散在不同地域以及不同部门之间的信息内容进行有机融合,然后在对其进行合理的转换以及加工,并将其存储到数据仓库当中。随后,在利用恰当的分析技术,对数据仓库内的数据内容进行分析,其在大量的物流信息中,寻找到一定的规律,为管理人员提供有利的数据信息支持,从而做出准确合理的决策。
2 系统总体设计
系统总体设计流程分为数据对接、数据仓库建模、ETL(Extract-Transform-Load,抽取-转换-加载)和数据展示4 个部分。数据对接用于采集来自口岸办系统、GPS 监管系统、物流园区系统等数据。数据仓库建模包括设计并搭建数据仓库用于集成所有行业数据。ETL 用于对行业原始数据进行处理并装载至数据仓库。数据展示是以数据可视化作为关键技术,基于数据仓库构造的互联网应用系统,实现了对集装箱行业数据的展示。系统总体设计如图1 所示。
图1 系统架构图Fig.1 System architecture diagram
3 数据仓库主题
数据仓库的主要特点之一是面向主题,所以在数据仓库的设计工作中,确定主题域是一项很重要的工作。集装箱多式联运信息管理平台是为各个子系统提供信息服务的,主要面向的对象有用户(如,货主、货代、承运人、集装箱租赁公司、港口堆场、货运站)、政府监管部门以及金融保险相关行业,为其提供基于不同数据要素、数据维度、时间跨度与表现形式的系列化服务与数据展现,如集装箱跟踪、集装箱调度、供应链管理、市场运行监测、行业预测、效能评估等综合性服务。集装箱多式联运信息管理平台主要面向的主题如图2 所示。
图2 系统主要面向主题Fig.2 The system is mainly subject-oriented
4 具体模块设计
本平台采用维度数据仓库,它由一系列星型模型组成,并由它们获取尽可能详尽的数据。我们从其他行业信息系统中抽取出维度数据,获取事实数据,例如可以从各集装箱物流园区系统抽取集装箱车辆的作业时间等来形成车辆作业事实表。通过各种维度表和事实表的创建,可以形成多个星型模型,从而实现对集装箱行业数据的面向主题的集成,方便对于数据的查询、展示与分析。
4.1 数据仓库建模
数据仓库建模主要分为选取业务流程、定义粒度和维度、确定事实三个部分。
(1)结合对业务需求和原始数据的理解,确定建模的业务处理内容。集装箱多式联运涉及委托运输、订立合同、提箱报关装箱、签发多式联运单据、交付货物、装车发运、短驳和订舱送箱等。
(2)数据仓库的粒度大小是数据仓库设计中需要考虑的重点问题,其不但影响到数据仓库中数据存储量的大小和存储架构,而且还会影响到其与数据仓库应用者的交互方式和问答类型。由于原子型数据可为分析提供最大限度的灵活性,所以应优先考虑用业务流程记录最细粒度的信息开发维度模型。
粒度确定后形成基本维度。选择年度分布维、货物类型维、地域分布维和揽货方式维四个维度,其中货物类型维度是由货物类别和货物名称构成的复合维度,地域分布维是由地、市、办事处构成的复合维度。
(3)确定事实,即要分析的度量。在数据仓库粒度分割中需要考虑的因素主要包括数据对象和数据量的大小、数据分割标准的难易程度以及数据分割标准与数据粒度划分策略的统一程度等。事实表和维度表的物流作业星形逻辑模块结构模式如图3 所示。
图3 数据仓库的星形业务逻辑模块结构Fig.3 Star-shaped business logic module structure of data warehouse
最后,在信息表和事实表的基础之上,采用MOLAP的方式建立数据立方体,即包含度量值和维的数据包,如图4 所示,并根据该立方体创建不同主题的计算成员,从而能够为业务的开展提供更多的决策支持信息。
图4 数据仓库数据立方体Fig.4 Data warehouse data cube
4.2 抽取—转换—加载
将数据源中的数据使用一定的要求和规则来予以过滤和清理。将完成数据转换后的目标数据加载到数据仓库中,并实时更新数据仓库数据,如图5 所示。
图5 ETL 架构图Fig.5 ETL architecture diagram
数据仓库技术的应用,能够根据决策者的不同需要,按照不同的应用主题对不同的数据信息进行组织支持,按照种类不同,进行重新分类组合,从而将分散在不同地域以及不同部门之间的信息内容进行有机融合,然后在对其进行合理的转换以及加工,并将其存储到数据仓库当中。随后,在利用恰当的分析技术,对数据仓库内的数据内容进行分析,建立数学评价模型,为决策者进行决策提供有利数据支持。
4.3 数据展示
数据可视化技术将大型数据集中起来以图形、图像形式加以表示,并利用数据分析和开发工具发现其中未知的信息,清晰有效地传达信息。
数据可视化有助于促进全员围绕关键数据分享协作以及管理层以全局性视角观察问题,从而最终形成数据驱动工作、数据支撑管理决策的良性循环。
数据可视化技术还与手机终端相结合,方便用户随时随地查看生产作业情况,实现多层次的数据上钻和下钻,强化分析功能,数据可视化从生产领域延伸至财务、人力资源等领域。
除了可视化服务外,平台还可以提供数据挖掘服务、数据在线分析处理服务、控制面板服务和数据报告等服务。
5 结语
基于数据仓库的集装箱多式联运信息管理平台通过对数据仓库的建模,抽取原始数据,转换并加载到仓库中,实现了对集装箱多式联运行业数据的有机整合,实现了数据的共享,使数据具有可视化价值,视觉元素多元化,信息传递更直观,提高相关部门的决策能力。
引用
[1] 吴慧鑫.中国集装箱运输和多式联运发展趋势[J].中国港口,2019(6):51-53.
[2] 任晓周,谌建飞,王永建,等.集装箱远程实时安全监测系统[J].电子设计工程,2019,27(1):116-122.
[3] ChristopherAdamson,亚当森,王红滨,等.Star Schema完全参考手册:数据仓库维度设计权威指南[M].北京:清华大学出版社,2012.
[4] Ralph Kimball,Margy Ross.数据仓库工具箱:维度建模的完全指南[M].北京:电子工业出版社,2003.
[5] 赵嘉凌.云环境下的分层数据仓库架构及其服务研究[J].现代信息科技,2018(1):180-181.