公路声像类电子文件元数据方案的设计与实践
2021-10-13黄世源
王 晨,黄世源
(1.广西北部湾投资集团有限公司,广西 南宁 530022;2.广西交通职业技术学院,广西 南宁 530023)
元数据是描述电子文件背景、内容、结构及其管理过程的数据。它是实现电子文件归档和电子档案管理不可或缺的信息,也是实现以影像档案溯源项目建设,综合项目其他电子文件,建设可视化档案,多维度溯源项目建设的桥梁。元数据具有动态性、多元性、庞大性的特点,它伴随着电子文件数据的产生而产生,真实地记录了声像电子文件的产生、保管、利用和销毁等整个过程。公路建设项目声像电子文件具有自身特点,既有的行业标准需要改良才更加符合行业实际的需求。
交通运输部在交通强国建设关键时刻印发了《推进综合交通运输大数据发展行动纲要(2020~2025年)》,明确实现综合交通运输大数据标准体系。国家档案局稳步推进电子档案单轨制运行。在此大背景下,有必要切入公路行业,设计实现具有明显行业特色和不可替代的公路影像文件元数据方案。
借鉴已有的文书类、照片类、录音录像类电子文件元数据方案,本文分析、比较公路声像档案特征,提出了公路声像文件元数据方案的设计方案,融合到已开发的《公路建设项目影像档案溯源系统》软件进行检验,证明可行、可靠。
1 电子文件元数据既有方案比较
现有的行业标准中,根据电子文件背景、内容、结构及用途的不同,设计了文书类、照片类、录音录像类电子文件元数据方案。比较现有的三大类电子文件元数据方案,存在着以下差异,汇总如表1。
但所有电子文件元数据的著录都存在相通性,很多元数据信息预先设定,反复利用。
其中,LCCIi为i单元的土地资源承载力指数;Pia为i单元现实人口数量。根据LCCIi的大小就可以量化区域的土地承载力状况,进行评价分级。
2 公路声像类电子文件元数据方案分析
2.1 公路声像类电子文件特点
(5)关联元数据信息。为每份归档电子文件建立大的职能背景信息,维护文件的凭证性。该元数据不属于描述责任者之间的关系,为溯源提供便捷途径的一种方式。
朱易聪明伶俐,四五岁时就显示出了运动天赋,对足球、乒乓球、滑雪、跆拳道等都很感兴趣。但父母却没有采取传统的中国式教育方式,将她管束得中规中矩,而是任由小家伙折腾,从不干涉。他们认为,只要孩子喜欢就好,不应该把自己的强项或爱好强加给女儿。
(4)足够溯源。声像类电子文件元数据的功能之一是为今后档案的开发利用提供识别路径。以声像档案溯源项目建设必须借助电子文件的元数据及电子封装技术。因此,元数据的信息量必须满足溯源的需求。
(3)人员专业背景复杂,流动性大。里程长,投资高,建设规模大的高速公路,每个项目直接参与声像文件采集活动的人员多达数百人,背景千差万别。所采集的声像文件质量、数量参差不齐。采集人员参与项目建设的时间短则几个月,长则与项目共秋色。这就要求采集者集拍摄、元数据基本信息著录于一体。
(4)摄影设备种类多。手机、专业摄影设备和航拍是目前拍摄的主要设备。手机的品牌繁多,拍摄的声像存在差异性。依赖人工推选最优照片,鉴定具有查考、利用价值的照片,编辑元数据工作量巨大。
比较表1可以看出依赖人工著录公路声像类电子文件元数据的难度。
2.2 元数据方案设计思路
(1)精简元素。目前公路数码照片采集者一般仅仅著录描述元数据的基本信息,也即简单的“六要素”:题名、说明、拍摄者、拍摄日期、唯一性标识编码、参见号。录像类电子文件除了上述简单的“六要素”,再增加电子文件类型、起始标志、结束标志等三个要素。这些基本元数据信息适用于传统的冲晒纸质照片和刻录光盘等磁性介质存储的录音、录像。
4、生物质固化成型技术。生物质固化技术是指在高压或高温高压下通过生物质中木质素的塑化黏合,把原来疏松的生物质压缩成密度极高的高品质成型燃料,以便储运和高效率燃烧的技术。
(2)具体信息。照片类电子文件的具体信息是指其特征信息。其中包括3个核心元数据元素,即:大小、格式、分辨率。这些信息是系统读入上载系统后,由系统自动鉴别、生成。若分辨率不能满足规定值则系统提出警示。
(2)系统辅助。声像档案实现单轨制运行的基础条件是具备计算机专业管理系统。分析比较,公路声像类文件大量的元数据信息可以通过系统管理,实现人工辅助,一次录入,反复调用;系统具备元数据自动鉴别,生成固化表格信息表的功能。
由于气蚀的严重性往往发生在金属表面,也可在阀芯、阀座、阀座后流道处喷涂碳化钨或堆焊一层硬质合金,即表面硬化处理,推荐选用STL合金。
(3)表述清楚。声像类电子文件元数据信息,既要求摄影者、管理者有一定的语言文字表达能力,元数据信息固化表格设置更要精炼。系统根据预设的已知条件,基本能自动生成声像题名、说明等关键信息。
(2)穿越时空长。公路项目从筹备到竣(交)工验收,短则5~6年,长则达10年之久。项目建设产生的影像文件,所经历的人员更迭,设备置换,对项目声像电子文件元数据信息著录产生巨大影响。
2.3 电子文件元数据的层次结构
电子文件元数据所包含的信息从根本上取决于元数据的结构。综合文书、照片、录音录像类电子文件元数据既有设计方案,电子文件元数据层次结构可以用图1表示。整合基本功能相同的元数据元素,从描述元数据、管理元数据和关联元数据3个方面设计元数据结构,并给出每个模块的核心元数据。这种利用多维元数据的关联特征,可以高效、快速检索和溯源项目建设。
图1 电子文件元数据层次结构
2.4 照片类电子文件元数据分析
(4)对象记录信息。照片类电子文件原始性鉴定和修改记录的信息,是保证信息完整性、提高照片类电子文件鉴定效率的必要工具。它主要包括两个核心元数据元素,即:鉴定记录(鉴定日期、鉴定人、鉴定结果)和修复记录(修复时间、修复人、修复情况)。这类信息一般由后台管理者著录。
给予对照组优质低蛋白饮食、适度运动、口服降糖药物并/或给予胰岛素皮下注射等综合治疗,使患者空腹血糖降至7.0mmol/L以下,产后2h血糖降至10.0mmol/L以下;同时令患者口服ACEI类药物或ARB类药物,对合并高血压患者则联合如钙通道阻滞药等其它降压药进行降压治疗,以将患者血压控制在130/80mm Hg以下;若患者合并高脂血症,则予以积极降血脂治疗,以将其血脂控制达标。在此基础上给予观察组羟苯磺酸钙(生产企业:江苏万高药业有限公司;批准文号:国药准字H20080288)治疗:进餐时口服,0.5g/次,3次/天。共连续治疗12周。治疗第12周时对患者复查其尿蛋白及各项生化指标。
(3)机构管理信息。系统对照片类电子文件在机构内保管情况的记录,主要包括2个核心元数据元素,即:来源记录(来源、取得方式、时间)和保管信息(登记号、保管位置、责任人)。这类信息是系统后台管理者著录。
(1)基本信息。照片类电子文件的基本信息是指对照片类电子文件进行描述的基本属性,也是信息检索的核心模块。其中包括6个核心元数据元素,即:摄影者、摄影时间、题名、说明(地点、人物、背景)、编号、参见号。这些基本信息在系统中要由摄影者著录。
(1)海量声像文件。公路建设项目从项目筹划到竣(交)工验收会产生海量的具有查考、利用价值的声像文件。以广西荔浦至玉林高速公路为例,全线桥梁桩基6 346根。按照广西壮族自治区档案局印发的文件,每根桩产生4~12张照片(1~3张/工序),全线将有2~7万张照片,但照片数量还不到整个项目照片总量的5%。传统的冲晒纸质照片存档方式存储显然不适应时代需求。
胰蛋白胨、乙酸钠、牛肉浸膏:国药集团化学试剂有限公司;引物、PCR Master Mix、细菌基因组提取试剂盒:天根生化科技有限公司;革兰氏染色液:南京建成科技有限公司;其他试剂:均为分析纯。
2.5 录音录像类电子文件元数据分析
(1)基本信息。录音录像类电子文件进行描述的基本属性,也是信息检索的核心模块。其中包括6个核心元数据元素,即:摄录者、摄录时间、编辑者、数字化时间、题名、说明(地点、人物、背景)。这类信息需要摄影者著录。
(2)具体信息。描述其特征信息,其中包括6个核心元数据元素,即:时间长度、总帧数、起始时间、结束时间、起始标志、结束标志。这类信息系统自动判别和生成。
(3)机构管理信息。主要包括2个核心元数据元素,即:来源记录(来源、取得方式、时间)和存储信息(在线存储地址、离线存储地址、登记号、责任人)。这类信息有系统后台管理者著录。
(4)对象记录信息。录音录像类电子文件原始性鉴定和修改记录的信息,是保证信息完整性、提高录音录像类电子文件鉴定效率的必要工具。它主要包括两个核心元数据元素,即:鉴定记录(鉴定日期、鉴定人、鉴定结果)和修复记录(修复时间、修复人、修复情况)。这类数据由后台管理者著录。
以关联元数据为例,系统预设固化表格式样如表2,人工录入加计算机辅助读取,完成一个声像文件信息著录。
3 公路声像类电子文件元数据方案设计
3.1 元数据著录方式
依据标准的元数据元素,公路声像类电子文件元数据方案应采用计算机管理,划分为三大著录方式。
表2 关联元数据固化表格式样
(1)反复调用类元数据。系统预选设定,整个项目或采集单位反复调用类,元数据主要包括:项目代号,采集单位信息,全宗号,组别代号,单位代号,用户权限,管理员权限,用户信息(用户账号、密码、姓名、手机号及其他),管理员信息(管理员账号、密码、姓名、及其他),标识编码固定段位,会议类别号,事件级别号,照片查看格式,视频播放格式,数字签名,等等。
2007年葡萄牙大波尔图大学的Fernando Almeida等人设计了一种用于机器人的多自由度主动柔顺末端操作器,主要由直流电机、滚柱丝杠和上下平台等组成,通过6个直流电机控制上下平台的位姿,实现多自由度主动柔顺控制,如图31所示[43]。
(2)系统自动生成类元数据。这类元数据主要包括:捕获设备,格式信息(原生、转换),图像、视频和音频参数,拍摄和上传时间,录音录像类起讫时间,流水号,系统时间,下载日期,浏览量,下载量,元数据校验,等等。
(3)人工录入,选择性录入或系统辅助类元数据。这类元数据包括采集者或著录者通过文字录入,语音转换中文,或系统生成关键信息后修改。主要包括:题名,说明,拍摄者,保管期限,聚类,编辑者,参见号,等等。
为了提高防护结构抵御空间碎片超高速撞击的能力,增强型防护结构采用多个缓冲屏或在缓冲屏和舱壁之间增加填充层,对弹丸进行层层拦截,使弹丸尽可能发生破碎、熔化或汽化,以降低对航天器舱壁造成的损伤。增强型防护结构缓冲屏的层数增加到了2~5层。为了进一步提高防护性能,缓冲屏采用高弹性模量、高强度的复合材料替代金属板材料,而填充层多用拉伸强度高的材料Nextel、Kevlar、Vectran、碳化硅和玄武岩纤维布等。
这些元数据信息设置成固化表格,作为数据库的组成。每一个电子文件上载系统后,按照这三种类型的元数据进行著录及保存。
综上所述,DPN患者使用胰激肽原酶联合木丹颗粒与甲钻胺治疗,疗效较好,临床应用方便,不良反应较轻,值得临床医疗实践中推广应用。
3.2 以溯源为目标的声像电子文件聚类
按照广西壮族自治区档案局印发的文件,结合公路工程单位、分部、分项工程划分,公路影像溯源系统将声像文件划分为20聚类,表3所示。每个聚类下面可能还有族。
表3 公路声像文件组别
续表3
每个聚类声像文件保管期限按照工程特征,划分为永久、30年和10年。一些聚类与其他聚类组合,才能形成溯源实践的完整性。
3.3 制定声像文件的唯一性标识编码规则
声像类电子文件的唯一性标识编码既是元数据的基本信息,也是实现溯源的最便捷路径。引用课题成果,以“项目代号+属性+保管期限+类别+流水号”五段位作为标识编码。系统导入预设的编码规则或编码,如单位分部分项工程标识编码表,每一个声像电子文件就有了唯一的身份证。图2中每次采集一次,选择一次类别、单位分部分项等基本信息。以图2这帧照片为例,系统自动生成的标识编码隐含了以下元数据信息。
银蛇欢舞辞旧岁,金马奔腾迎新春,在这辞旧迎新的日子里,保定市力达塑业有限公司通过《中国水利》杂志向各界朋友致以节日的问候,祝大家在新的一年里身体健康、万事如意、阖家幸福!
范例1:S51GXLN-407-30-3S03E01C01A-1,这张照片标识编码隐含着以下这些元数据信息:桂南二线高速公路广西柳州经合山至南宁段(S51GXLN),广西路桥集团新柳南第7合同段(407),保管期限30年(30),质保资料(3),弄桥隧道左洞单位工程(S03,划分表预先设定,下同),洞身衬砌分部工程(E01),钢筋网支护分项工程(C01),第一道工序(A)),第一张照片(1)。标识编码的元数据自动进入系统表格,并在照片周边中文显示隐含的信息。
3.4 溯源系统的设计实现
(1)系统基于以溯源为目标而设计。表3、单位、分部、分项、工序划分及唯一性标识编码自动生成,作为元数据著录的主要载体。采用B/S构架开发,系统运行环境兼容Microsoft Windows server 2012R2Standard以上操作系统,Intel(R)Xeon(R)Platinum 81 632.5达GHz处理器,最低内存8G,主流浏览器皆可。
(2)溯源方式。系统采用多层状溯源,以PDF格式显示。以表3的聚类、单位分部分项工程、事件等单项或组合方式溯源。用户选择查看某段项目建设中的具体形成过程,系统以幻灯片播放的方式展现视觉效果。
王加启等[38]利用瘤胃持续模拟装置研究了日粮精粗比为7∶3、1∶1和3∶3时对NDF降解率的影响,结果表明日粮精粗比为1∶1时,NDF降解率最高,当精粗比增加到7∶3时,NDF降解率降低。赵祥等[39]报道,绵羊瘤胃中不同精粗比TMR的NDF有效降解率随精料水平提高而降低。胡琳等[40]研究了以木薯茎叶为粗料、不同精粗比全混合日粮养分在山羊瘤胃中的降解率,结果表明日粮精粗比为5∶5时NDF有效降解率显著高于精粗比为2∶8、3∶7、4∶6、6∶4和7∶3的实验组(P<0.05)。
4 公路声像类电子文件元数据的实践
4.1 采集-著录一体化的元数据
限于篇幅,本文仅以现场声像采集人员著录的元数据信息为例加以说明。
按照多层状溯源,根据预先设定的聚类信息、单位分部分项工程划分表,采集人员直接在声像采集时同步下拉菜单中选择完成。图2是广西北部湾投资集团有限公司施工的柳州经合山至南宁高速公路第7合同段手机APP现场采集照片,同步完成该照片的元数据基本信息及部分具体信息的著录。
灰度共生矩阵通过计算图像中相应距离和相应方向上不同两点灰度之间的相关性,来客观反映出图像在关于方向、变化幅度、相邻间隔以及快慢的问题上的综合信息[10-11]。本文利用灰度共生矩阵提取干制红枣图像的多个纹理特征参数,选取不具有相关性的纹理特征参数作为分类算法的输入。
图2 APP现场声像采集与元数据著录一体化
4.2 APP采集与著录
系统设置语言转换中文功能,大大减轻现场文字输入的工作量。采集时选择开启坐标等模式,系统自动生成照片拍摄部位所在位置的坐标、海拔高程、天气、温度、里程桩号、时间、像素、分辨率等元素,并自动输入到固化的表格,进入数据库。根据用户选择,部分信息元素在照片显示,部分则隐藏。
4.3 其他元数据的著录
结合图2中在采集时的元数据信息,通过文字录入或语音录入,或系统生成,图1的描述元数据基本信息著录完毕,自动生成固定格式表格。系统同时生成大小、格式、分辨率、存储格式等具体元数据。机构管理信息、对象记录信息和关联元数据信息,如档案馆代码、门类代码、档号、修改时间、权限等等元数据,归档后有专业档案人员著录。
5 结 语
本文在国内首次提出改良并设计了以溯源项目建设为目标的公路声像电子文件元数据设计方案,并应用到自主开发的《公路建设项目影像档案溯源系统》中。研究成果在广西荔浦至玉林、柳州经合山至南宁等公路项目的推广应用超过800 km。实践效果证明。
(1)本文改良设计的声像类电子文件元数据方案适合公路行业;
(2)应根据声像类电子文件使用目的来设计元数据方案;
(3)声像类电子文件的元数据方案应融入到档案管理系统。