APP下载

文档格式公共知识形成的过程和要素*

2020-07-17

山西档案 2020年3期
关键词:文档群体主体

(中国人民大学信息资源管理学院 北京 100872)

0 引言

我们为什么要关心格式?简单地说,问题是当我们回顾一百年后的今天,我们是否能够读到我们今天所做的记录[1]。各机构以不同的私有格式储存其电子记录,带来了一种风险,即记录将来可能无法访问,它们被锁定在私有格式中,这种格式在未来可能是不可读的,或者受制于限制访问的私有系统。私有格式的数据表示规范不公开,其专属性使得文档内部信息的读取只能依赖特定的软件,而且不能够支持文档跨平台、跨时间、跨版本、跨格式的互操作。为了打破私有格式的垄断,实现文档之间的互操作,开放格式应运而生。开放格式具有互通性和继承性,这些优势使得开放格式在全球范围内得到了大力支持。

可以说,目前我国文档格式存在格式类型和数量多样化的问题,这给电子文件长期保存和开放共享利用带来了挑战:一是文档格式一般都是由应用系统生成,与特定软件的捆绑使得文档的存取与利用深受软件升级或淘汰影响;二是频繁进行格式之间的转换不仅花费巨大,而且转化过程中,文档的表现形式与结构容易发生改变,难以保障其真实性与完整性;三是格式的多样性和对软件的依赖性不利于文档信息内容的共享与交流;四是格式标准体系不完善,标准尚未得到全面落实。总的来说,文档格式存在的不开放、不可控、不统一问题,造成了文档交换有障碍、长期保存有风险、应用扩展有困难[2][3]。

在2020年实现党政机关电子公文全国产化代替目标下,掌握对电子文件这一国家重要战略资源的话语权,不受限于外部厂商,真正实现自主可控,党政机关公文、数字化纸质文件、数字图书、证照以及一些不得涂改的资料等的存储归档需要一个知识产权自主可控、技术能力自主可控和发展自主可控的文档格式[4]。

《国家电子文件管理“十三五”规划》要求到“2020年主要基础标准和重点行业标准制定发布,形成比较完备的标准体系,党政机关电子公文实现标准化普及。”[5]从采用国际标准到探索自主知识产权标准,我国的文档格式标准化工作已经走过了很长的一段路,也出现了很多成果。但从实际使用情况来看,国产标准文档格式的发展并不尽如人意。在2007年成为国家标准的“标文通”UOF格式,经过十年的发展并没有能够如预期那样普及化。2016年国产版式文档格式OFD成为新的国家标准,但目前仍处于开发应用的初步阶段。OFD是否能够冲出多种文档格式的重重包围,实现文档格式标准统一化,又或者是成为下一个UOF,还不可知。

公共知识概念最早由逻辑学家刘易斯(C. I. Lewis)提出,经逻辑学家欣提卡(J. Hintikka)和经济学家奥曼(R. J. Aumann)等人的发展,今天已经成为逻辑学、博弈论、人工智能等学科里频繁使用的一个概念。公共知识在我们的日常对话、交流中起着非常重要的作用,也可以用来解释某些社会现象。在社会生活中,人们为了互相交流或者成功地进行协作,特别地需要公共知识。如果一个互动结果以失败告终,往往是由于参与活动的主体没有能够获得使活动成功进行的公共知识。

作为一种约定规则,公共知识有助于多主体达成协议,协调行动,维持协作。我国文档格式管理中存在的问题是多方力量作用的结果,其解决同样需要多主体之间达成共识,进行协作互动。在文档格式管理中,公共知识可以协调文档格式主体理性,实现文档格式主体认识一致性,规范文档格式主体行为。因此,本文认为,为了优化文档格式管理,有必要在文档格式管理生命周期涉及的各个主体之间形成公共知识。

1 文档格式管理现状

1.1 文档格式多样化

文档格式的发展伴随着格式标准化进程,为了扩大PDF的影响力,Adobe公司积极参与国际标准化组织的活动,推动PDF格式的标准化。2005年,Adobe公司在研究电子文件长期保存需求的基础上优化PDF形成了PDF/A-1,成为国际标准ISO 19005-1:2005。2008年,第一个PDF全功能的国际标准ISO 32000-1:2008发布。2011年,ISO/CD 32000-2将PDF版本更新为PDF2.0。同年,ISO 19005-2公布,在PDF/A-1的基础上加入新的特性形成了PDF/A-2,成为文档领域文件的标准格式。随着可扩展标记语言XML的标准化,开放文档格式联盟和OASIS标准组织制定了基于XML的开放文档格式(Open Document Format,ODF),ODF格式于2006年成为国际标准ISO/IEC 26300:2006,它作为一种开放格式,可以在不同程序之间交换文件。微软的Office Open XML(OOXML)文档格式也于2008年通过评审成为一项国际标准ISO/IEC 29500:2008。

早期,我国主要采用国外的标准,使用PDF作为数字资源长期保存的格式。此外,方正阿帕比CEBX格式、书生SEP格式和知网CAJ格式也在特定领域使用。为了摆脱被动文档格式选择问题,我国在2007年推出了具有自主知识产权的“标文通”GB/T20916-2007《中文办公软件文档格式规范》(Uniform Office document Format,UOF)[6],UOF是一种基于XML的开放文档格式。从2010年开始,我国启动“版式文档格式标准研制、软件研发和示范应用”课题,2016年正式实施国家标准《电子文件存储与交换格式版式文档》(Open Fixed-layout Document,OFD)。

从国内文档格式发展情况来看,文档格式正在经历从完全私有格式向开放格式的发展进程。目前,我国文档格式市场仍然处于开放格式和私有格式并存的局面。主要开放格式有PDF、ODF、OOXML、DjVu,国内的UOF和OFD;私有格式方面,国内方正的CEB/CEBX格式、书生的SEP格式在办公文档领域使用较为广泛。以上提到文档格式的简介见表1。

从表1对目前主要文档格式开放程度、标准化程度以及使用情况的概况来看,我国文档格式的发展呈现出两种趋势:一是从私有格式向开放格式的发展趋势;二是格式向标准化发展的趋势。同时,也可以看到在这两种趋势发展过程中,存在三个问题:一是私有格式和开放格式多样化,形成两个格式阵营对立局面;二是开放格式的开放程度不高,大部分开放格式难以做到格式规范公开的同时软件开源;三是我国格式标准化程度不高,没有形成国际标准,现有标准实施难以统一国内格式市场。在现有文档格式市场上,虽然是私有格式和开放格式并存,但是就开放格式而言,国外Adobe公司的PDF格式占据了极大部分市场,进入市场时间早,用户基础大,在国内软件厂商中也有较高的支持度。因此,国产自主可控开放格式的发展面临私有格式和国外开放格式的双重夹击。

表1 常用文档格式开放程度、标准化程度与使用情况

1.2 私有格式与开放格式协调难题

私有格式的数据描述模式不是透明的,且其规范不能公开读取。开放格式的数据描述模式透明且规范公开可读,通常是由公共机构或者国际组织制定的。使用私有格式存在两大问题,一是其不公开、不透明使得各格式之间无法兼容,不利于文件之间交换共享;二是私有格式对软件厂商有极大的依赖性,格式升级或停产取决于软件厂商,无法保障文件可读性与长期保存性。因此,开放格式是更好的选择,对文档格式多样化现状的分析也表明开放格式更受到文档机构的认可,而且国家也更倾向于支持国产自主可控文档格式的发展。

广义的协调博弈是指一个有多个纳什均衡的博弈,所有参与人的结果在任何一个均衡点上都好于非均衡点,但是在不同均衡点,参与人的收益是有差异的[7]。在这个博弈中,博弈参与者不仅关心在均衡点实现博弈结果,还希望博弈在他所偏好的均衡点上实现。博弈参与者关心的两个方面,体现了彼此之间合作与冲突的关系。

文档格式使用者与生产者关于私有格式和开放格式的博弈构成了一个广义的协调博弈。博弈情形如下:文档格式使用者基于文档可读性、安全性、长期保存和开放利用等方面的考量,更倾向于使用开放格式。文档格式生产者研发生产属于自己的私有格式已经在市场上有了一定的用户基础,且用户粘性使得其有稳定的收益,受利益的驱使其不会愿意放弃私有格式。但只有他们选择同一类格式,才能避免一个没有产品支持和一个没有用户支持的局面。也就是说,文档格式使用者和生产者之间博弈的结果必然收敛于一个纯策略。在这个博弈中,出现了两个纯策略纳什均衡——两者都选择开放格式和两者都选择私有格式。同时,还有混合策略均衡:一个选择开放格式、另一个选择私有格式。两者之间的博弈情形如表 2 所示(注:表中 a〉b,c〈d,c+d〉a+b)。

表2 私有格式与开放格式之间的协调难题

在这个博弈中,文档格式使用者和生产者之间存在“合作”:选择同一策略;同时存在“冲突”:一个希望选择开放格式,一个希望选择私有格式,但是这两种选择不能同时满足。文档格式群体中文档格式使用者和生产者之间关于私有格式和开放格式的协调难题使得文档格式多样化现状难以改变。

1.3 文档格式“个体理性”与“集体理性”两难情景

社会两难(Social Dilemmas)描述的是个体利益与集体利益存在冲突的情形下,群体成员为了个体利益,忽略群体利益,最终导致更多损失的情景[8]。在文档格式群体中,关于国产开放格式和其他格式的竞争与合作体现了“个体理性”和“集体理性”的两难情景。在国家出台政策要求大力推广国产自主可控开放格式,并且在政府部门和档案机构已经开展试点应用的发展背景下,文档格式群体的格式选择有国产开放格式和其他格式两种策略。其他格式是个体理性下的选择,国产开放格式是基于集体利益考虑下的选择。

从目前已有文档格式使用情况来看,拥有私有格式的格式生产者控制着格式的发展,有自己的用户粘性基础,能够获得较大的利益,使得其不愿意放弃对私有格式的控制。而国外开放格式在国内文档领域市场占有率很高,有较强的用户基础,在国内软件业也有较高的支持率,支持国外开放格式的软件厂商不愿意放弃已有的用户群体。此外,文档格式使用者基于格式更换成本、风险等方面的考量,难以响应政策制度。这些都使得国产开放格式的发展面临着“个体理性”和“集体理性”冲突的两难情景, 推广应用受到阻碍,长远可持续发展难以得到保障。

2 理论基础与概念内涵

2.1 理论基础

2.1.1 知道逻辑理论

认知逻辑是关于知识和信念的逻辑,它将“知道”、“相信”等表达认知关系的特殊语词作为逻辑算子处理,来分析处理认知推演关系,建立与人的认知行为相符合的推理模型[9]。知道逻辑是认知逻辑的一个重要分支,可以用来描述现实中主体的认知状态。其在命题逻辑的语言上引入知道算子“K”,用来描述主体与命题之间的认知关系。主体知道一个命题P,意味着主体拥有知识P,即“Kap”。“知道”有两层涵义:“一是知道的事情是真的,二是理性的知道。”[10]“Kap”成立的必要条件有三点:“一是P是真实的;二是a相信P;三是a有充分的理由相信P。”[11]在表现知识交流方面,知道逻辑发展出了多主体认识、共同知识和算法知识[12]。在本文的研究中,文档格式群体是一个多主体系统,主体之间不断进行着知识的交流和传递,形成群体认知。

2.1.2 公共知识“共享情境”

公共知识的产生需要通过某种共享情境,共享情境为可观察的情境行动提供了一个基础,行动又生成更进一步的共享情境。共享情境是群体的公共知识在获取时的一种宽泛意义上的背景环境,其作用不仅是能够产生公共知识,还能为公共知识的维持提供一个平台[13][14][15]。在一个具体情境中形成公共知识,总会先有一个状态背景,然后是基于该状态背景的可能行动方式。在公共知识的形成过程中,不同的群体,具体的不同的协作方案,会有不同的共享情境,在这种情境中共享的要素有很多种。它一般包含群体的背景知识状态和群体的选择方式和倾向。群体的背景知识状态在一定程度上影响群体成员选择偏向[16]。

2.2 文档格式公共知识

2.2.1 文档格式公共知识概念

从知识的角度来看,在文档格式群体内,主体采用某种格式是在主体拥有了关于这种格式知识基础之上做出的行为决策。如果群体内所有成员互相知道彼此的行动选择,并且这种行为选择具有一致性,那么在群体内就能够形成公共知识。文档格式公共知识可以理解为在文档格式群体中形成的一种被主体成员认可接受,对行为决策具有指导规范作用的群体认知。

2.2.2 文档格式公共知识群体

根据电子文件全程管理理论,从文件形成到归档中涉及的文档格式主要包括文件形成机构文件形成格式和档案机构归档格式。因此,在文档格式群体中,与文档格式相关的主体应该包括文件形成之初的形成机构、文件归档的档案机构以及与这两个机构开展业务合作的格式厂商、软件厂商。此外,文档格式的研发和推广离不开政府机构的引导、支持,文档格式的标准化离不开标准化组织。根据几个主体的性质和作用,将其分为参与主体和辅助主体。参与主体是指直接参与文档格式公共知识形成的档案机构、文件形成机构和格式、软件厂商,公共知识在由这类主体组成的文档格式群体中形成。辅助主体是政府主管机关和标准化组织,不直接参与公共知识的形成,但是为公共知识的形成提供政策导向、资金支持、制度法规、标准规范。文档格式公共知识群体包括的主体如图1所示。

图1 文档格式公共知识群体构成

3 文档格式公共知识形成过程

公共知识形成的实质是群体成员之间不断进行知识的传递,知识在群体内不断扩散,达到群体互知的状态[15]。考虑到文档格式公共知识形成涉及的是整个群体,需要主体在一个较长的时间内进行协调互动。

在认知阶段,主体对文档格式知识是形成一种认知上的知觉,知道有这么一种知识,而在接受阶段,形成的就是一种情绪上的态度。主体在了解一种文档格式知识后,才会开始形成对这种知识的观点和态度。成功的知识传递离不开知识的接受。这里的“接受”是一个态度算子,指理解某个命题P,并且基于这样的理解来相信P,是个体对知识的一种信念,而不包括采纳等行为[12]。

认知、态度和实际使用之间存在“KAP差距”(KAP是指认知—态度—实践)。因而在很多情况下,态度并不一定能转化为行为,主体愿意接受并不代表主体会付出实际行动。“采纳”是接受并采用,文档格式采纳是指文档格式主体在情感上愿意接受某种格式,做出决策后实际采用该种文档格式。在文档格式的接受-采纳阶段,主体由于对格式应用的不确定性,一部分选择观望,暂时不采纳,另一部分或主动或被动实施采纳行为。在采纳阶段,实施采纳行为也不是一成不变的,在实施过程中,达到期望效果的主体会选择继续采纳,而没有达到期望效果的主体在没有惩罚约束的情形下可能会选择及时止损、中止采纳。主体在认知、接受的基础上采纳某种格式知识,可以形成公共知识,但这种公共知识只是在共同行动的主体之间形成,并不是在文档格式这个大群体内形成的公共知识。

在现实协作中,往往是先有一个具体的协作群体,然后在具体的协作背景之下才产生具体的公共知识[16]。文档格式主体之间协调互动的形式就是合作,合作为文档格式公共知识的产生提供了一个共享情境,公共知识产生于合作情境,形成之后维持合作的稳定性。文档格式公共知识在认知、接受和采纳阶段处于个体的小范围阶段,合作就是要把个体联结起来,形成整体。主体选择合作的本质是为了个人利益最大化而作出的行为决策,在利益的诉求下选择某种博弈策略。主体之间具有策略模仿和观察学习特征,公共知识在群体内的演化扩散就像生物群落的繁殖。处于公共知识形成任一阶段的个体,其行为策略的选择将会受到学习对象的影响,进而扩散到整个群体中。

认知、接受和采纳是在文档格式群体成员个体层面的演化,合作是在文档格式群体范围内的演化,只有在个体对某知识认知、接受、采纳的基础上,主体之间才会有可能产生合作。合作是群体公共知识产生的共享情境,合作情境里的主体在某种约定的指引下不断协调行动,主体之间具有策略模仿和学习特征,合作的获益吸引更多的主体选择合作策略,约定在群体范围内不断扩散。在合作情境中,主体的行为受到约定的规范,经过重复多次博弈的长期过程,约定作用的主体不断增多,范围不断扩大。这种由合作形成的约定就是群体的公共知识,在它的规范下主体规范行为、协调行动。

从我国现有文档格式使用情况来看,Adobe公司的PDF格式在国内用户基础较大。虽然PDF是一种开放的国际标准,但该格式的自主权并不由我国掌握。为了掌握格式自主权,我国相继研发了UOF和OFD格式,目前正在国内推广普及。另外,国内很多软件厂商的私有格式在不同领域被广泛使用,如方正的CEB/CEBX格式在党委机关使用较多,书生的SEP格式在政府部门使用较多,知网的CAJ格式普遍使用在学术期刊领域。

本节参考创新扩散理论中创新的扩散阶段[17]:认知、说服、决定、实施以及确认的基础上,利用知道逻辑理论里“知道”算子对主体认知状态进行分析,引入“接受”这一认识态度算子,形成文档格式公共知识的“认识簇”,并在“认识簇”基础上加上“采纳”这一行动算子和共享情境的“合作”算子,将文档格式公共知识形成过程概念化成认知、接受、采纳、合作四个阶段。文档格式公共知识形成过程如图2所示(以开放格式PDF格式和OFD格式为例),斜向上箭头表明形成过程各个阶段之间是逐层递进的关系,后一阶段的演化建立在前一阶段的基础之上,整个过程由知识传递和知识扩散推进。

图2 文档格式公共知识形成过程的阶段演变

文档格式知识也可以在合作的小群体内形成近似公共知识,群体公共知识的形成伴随着主体之间的交流互动、共同行动,知识在各个小群体间进行传递、扩散,合作参与主体增多,从而不断扩大群体范围,“知道”结构的层级叠加与范围扩散使得在整个大群体形成近似公共知识,如图3(以私有格式CEB/CEBX格式和SEP格式为例),图中实心箭头表示主体间的“知道”关系,空心箭头表示“知道”结构的演进过程。

图3 文档格式公共知识群体内的扩散演变

4 文档格式公共知识形成要素

根据上节对文档格式公共知识形成过程的分析,文档格式公共知识形成过程涉及到主体的两种状态和两种行为,认知是个体对文档格式知识的认识,接受是个体对文档格式知识的情感态度,采纳是个体与个体的行为互动,合作是群体之间的行为互动,采纳可以看做是个体之间的合作。这些认知和行为的演变受到内外部环境的影响。因此,需要从认知、行为和环境三个层面的理论出发来识别文档格式公共知识形成要素。

文档格式公共知识形成过程的四个阶段是逐层递进的,前一阶段的实现影响后一阶段的演变。主体对知识的接受建立在主体对该知识形成了客观认知的基础上。技术接受模型用感知有用性和感知易用性来解释主体的接受意愿,有用性和易用性是主体在认知基础上形成的感知[18]。因此,文档格式公共知识从认知阶段过渡到接受阶段受到了主体对该知识感知有用性和感知易用性影响。

从适应性结构理论[19]来看,组织基于自身资源条件和能力条件对行为进行控制,基于市场竞争、政府政策对行为进行主观规范。从社会交换理论来看,群体合作行为能够实现实际是各主体基于成本与收益做出的一种行为选择,对利益的追求是合作的一种动机[20],信任是影响个人、群体合作的重要因素,可以削减合作的不确定性和易变性[21][22]。因此,文档格式公共知识从接受阶段过渡到采纳和合作阶段受到环境层面政策制度压力和市场竞争压力以及行为层面利益动机和信任的影响。

本研究按照认知、行为和环境三个层面,依据技术接受模型、适应性结构理论、社会交换理论识别三个层面中的要素。这些要素及其理论支持情况见表3。文档格式公共知识形成要素不是孤立存在的,要素彼此之间具有更进一步的互相影响关系,文档格式公共知识在这些要素交互影响下不断演化。本研究的后继工作,是通过定量方法研究这些要素对公共知识形成过程的影响。

表3 文档格式公共知识形成要素识别及其理论支持

5 结语

Why层面:(1)文档格式相关研究集中在格式选取原则、具体格式、格式标准、格式技术等方面,提出的格式管理方面措施并不多,且大同小异,多借助技术手段。(2)文档格式实际使用与管理中存在格式多样化、私有格式和开放格式协调难题以及“个体理性”和“集体理性”两难情景三个方面的问题。(3)公共知识能够协调文档格式主体理性、实现文档格式认识一致性以及规范文档格式主体行为,达到优化文档格式管理的目的。

What层面:(1)文档格式公共知识可以理解为在文档格式群体中形成的一种被主体成员认可接受,对行为决策具有指导规范作用的群体认知。(2)根据电子文件全程管理理论,将文档格式群体中的主体划分为包括文件形成机构、档案机构和格式、软件厂商的参与主体和包括政府主管部门和标准化组织的辅助主体。(3)根据知道逻辑理论、公共知识的共享情境解释和创新扩散理论确定了文档格式群体内公共知识从认知到接受再到采纳最后到合作的形成过程,这一过程四个阶段是逐层递进的,群体认知形成的合作情境建立在主体认知、接受和采纳的基础上。

How 层面:影响文档格式公共知识形成的要素来源于四个阶段,将形成要素划分为认知、环境和行为三个层面,结合技术接受模型、适应性结构理论和社会交换理论识别三个层面的要素。认知层面要素是主体对格式感知的有用性和易用性。环境层面是市场环境的市场竞争压力、政策环境的政策制度压力。行为层面是组织内的行为互惠和信任关系。

猜你喜欢

文档群体主体
强化述职评议 落实主体责任
浅谈Matlab与Word文档的应用接口
论碳审计主体
有人一声不吭向你扔了个文档
轻松编辑PDF文档
哪些群体容易“返贫”——受灾户、遇困户、边缘户
何谓“主体间性”
关爱地球,学生成主流群体
认清亏欠问题——对参与近期香港暴乱的青年群体之我见
“群体失语”需要警惕——“为官不言”也是腐败