基于开源精神的开源情报创新研究
2022-09-01洪磊
洪 磊
(1.江苏警官学院计算机信息与网络安全系,江苏 南京 210031;2.江苏省数据工程与知识服务重点实验室(南京大学),江苏 南京 210023)
开源运动起源于计算机行业,来自于程序员对自由世界的向往,由此衍生的开源精神形成了思想风暴,促使人们开始更加关注平等、自由和开放的生活方式,开源社会[1]、开源经济[2]、开源科学[3]和开源外交[4]等逐渐成为世界发展主流。开源精神使人们发生了从理念到生活方式全方面的变革。
在情报界,开源精神和开源情报联系最为紧密,但是开源情报中的“开源”多被认为是信息来源的公开。这种理解限制了开源情报的变革,缺乏和开源精神真正的融合,使得开源情报只是表面的开放,没有实现开源变革,无法跟上开源时代的发展。本文在深入剖析开源运动的基础上,凝练开源精神,探究开源精神对开源情报理论的影响。借助开源运动中的成熟模式,构建开源情报的Pull-Request开发和众包生产开源创新应用模型,实现开源精神和开源情报的有机结合。
1 开源精神的界定
1998年4月7日,自由软件峰会在美国加州举办,建立了开源代码促进会(Open Source Initiative Association),通过了开源(Open Source)软件称谓的提议,开始了开源运动。2018年,轰轰烈烈的开源运动走过了20年,开源代码促进会官网中的纪念文章有这么一段话:在开源运动的第三个十年即将开始之际,人们被迫使用新的模式解决问题:云计算、物联网、大数据技术、区块链、5G等。但在解决这些问题时发现,开源运动最开始倡导的4个自由仍然至关重要:自由使用软件,开放源代码,自由更改源代码,平等分发源代码[5]。
如今,开源运动的影响力已经远远超出软件产业,它改变了社会的生产方式、消费习惯和工作方法,开源精神深入人心。在开源精神中,自然合作是基础,平等共享是条件,自由开放是目标。
1.1 自然合作是开源创新的行为基础
进化论认为,自然合作是人类生存的天性,也是开源运动的行为特征。个体之间为了生产出更好的产品,彰显自己的能力,而主动完善源代码,呈现出人人角逐的态势。社群之中,一方有难题,多方积极应答,帮助解决困难,体现出群体的利他性。面对共同的目标,个体协同配合,采取统一行动,表现出人类的合作天性。
合作、竞争和利他是进化论中的基本原则[6-7],也促使开源运动成为一个积极、团结和奋进的改革浪潮。互联网时代,开源运动是通过自组织合作,实现资源再配置,是自然选择原则在人类社会中的新演进。开源运动中,人们面对政府监管和趋利避害的市场分配时,为了突破封闭和固化的社会资源分配方式,以自组织的形式跨界合作[8],以去中心化的方式分配资源,利用人的主观能动性爆发最大生产力。
1.2 平等共享引领开源创新发展方向
开源运动中,程序员们要求开放源代码,开源的目标就是实现平等共享。作为计算机产业中的基础生产资料,源代码的共享增进了社群成员之间的社会生产关系。通过平等共享,每个人都能提高能力、获得利益,革新生产方式,提高生产力。平等共享指引了开源创新的方向,正如共产主义提出:社会需要实现生产公有制,尽快发展生产力,实现共同富裕[9]。
计算机发展过程中,软件商业化的行为违背了互联网开源开放的宗旨,开源运动是为了改变商业软件的私有化垄断,恢复软件共享文化。开源运动的组织形式不再是层阶式的官僚体系,而是扁平化的自由组织。每个人将平等和协作认定为共同理念,依据自身能力和任务需求,通过内部自适应的分配,在适合的位置贡献自己的力量,共享社群劳动成果,实现共同进步发展的目标。
1.3 互联网精神促进开源自由开放内核
1969年,互联网的开发者发布了互联网制度—请求协议(Request for Comments),呼吁开放和合作的互联网精神。互联网自诞生之日,就有着自由和开放的灵魂。之后互联网从军事走向大学,再从大学走向商业,最后成为全员工具。在互联网逐渐为人所知之时,程序员们再次发表了《赛博空间独立宣言》,宣布互联网是一个无歧视、无国界和无物质的自由世界[10]。
开源软件推动了互联网的发展,Linux操作系统成为众多平台的网络操作系统,MySQL成为众多互联网公司使用的数据库,Hadoop成为分布式处理的大数据软件框架。更重要的是,开源运动促进了互联网社区的活跃,加速了社交媒体的普及。程序员们为了反对Unix系统的商业化,以去中心化的跨界合作方式,合作完成了Linux系统的研制,并驱动了Linux社群的建立。程序员本着自由和协助的精神,建立了GitHub社区、CSDN社区和Stack Overflow社区等技术乌托邦,成为早期的社交媒体。
互联网精神和开源精神同根同源,都体现了有识之士的理想。互联网是为了打破大型计算机和局域网的垄断而建造自由的沟通平台;开源运动是为了打破商业软件的垄断而建立开放源代码合作机制。两者相互促进,互联网提供了开源社区的交流平台,开源软件成为互联网的支撑系统。互联网精神强调开放、平等、多元和自由,用户可以在互联网上传、下载资料、查看、发表言论,突破了文化、地域和时间的限制,任何人都可以根据自己的意愿运用互联网。互联网还是一个没有等级限制和官僚阶级的平台,这种自由平等促进了文化的多元化,使人们之间的差异性和独立性得到最大限度的包容。互联网精神引领了开源运动,开源运动承袭了互联网自由开放的精神,扩大了开源的影响力,并更加促进互联网的开放发展。
开源运动起源于计算机行业,迅速被人们所接受。开源运动不仅是生产方式的创新,其所代表的精神更是互联网时代以来人类发展的精髓,这种精神已经感染了社会的各行各业,更新了人们的理念,推动了“开源社会”的到来。为了实现自由开放的生产模式,需要让自然合作成为工作和生活的本能,将平等共享作为信奉的准则,全方面融入开源运动,实现生产方式的转变。
2 开源精神对开源情报的影响
开源精神赋予了开源情报理论内核和外延更多的意义,充分发挥了开源创新的变革力量。如图1所示,开源精神赋予开源情报开放的精神、多元化的情报人员、网络模式的情报结构、融合的情报方法和服务大众的宗旨,以人为本的自由诉求,驱动了情报社群工作的模式,以各持其能的协作,解决了数据湮没的困扰,通过开放减轻了民众对情报的芥蒂,通过协作增加了情报的价值。
图1 开源精神对开源情报理论的影响示意图
2.1 赋予开源情报开放精神
开源运动萌生于互联网时代,软件行业方兴未艾,商业软件垄断源代码,造成了社会公共需求与商业把持之间的冲突,在这个背景下,开源运动应运而生。数字信息已成为新的社会资源,情报机构对情报封闭式垄断与社会公众对情报共享和使用的期待形成矛盾,开源情报从社会公共利益角度,合理合规地解除秘密情报的约束;从情报角度,以独特的方式适应互联网,开发出高质量的情报产品。
开源情报中的“开源”二字因为开源运动被赋予了更多内涵。开源创新的自由、协作、共享、平等的精神拓展了开源情报理念的深度,在保持情报必要的“保密”性质之外,开源情报应该呈现更广阔的开放性,以适应这个不断变化、数据为王的数字化时代。
2.2 发展多元化的情报人员
情报人员原来只是封闭机构中的特定人员,如今情报工作更加复杂,需要数据科学、计算机科学、网络科学、军事学、公安学、社会学、法学、心理学和医学等专业知识,孤立的情报人员很难完全具备独自处理情报工作的能力。在某些特殊环境中,人力情报的作用有限。比如新冠肺炎疫情期间,疫区的人们居家隔离,情报人员无法通过侦察、蹲点等常规手段探取秘密情报,情报的主战场已经转移到网络平台。
开源情报的应用范围广泛,除了传统的军事、社会安全、反恐等秘密情报领域,因其特有的网络契合度,在网络安全、社交网络等领域更能发挥情报作用,并且在流行病预警、反垄断调查、幼童虐待等非传统安全领域发挥重要作用[11]。开源情报的应用需求不断增长,预计到2026年,全球对开源情报的商业需求将达到291.9亿美元[12]。快速增长的开源情报应用需求吸引了更多行业的人才加入情报工作,促进行业的多样性和丰富性。
开源运动中,程序员以网络社群为集合,根据兴趣、特长和爱好,寻找程序Bug,完善程序源代码,扩展程序功能。受此启发,开源情报工作人员范围应该扩大,打破藩篱,让政府工作人员、非政府组织人员、警察、研究机构人员、行业专家和情报爱好者等非情报机构工作人员加入开源情报工作,在情报搜集、整合、分类、分析和价值判定等方面,以自由的组织形态团结协作,以社会认同推动情报共享和智力贡献。开源情报社群中,每个人都是平等地分享、处理和拥有情报,以自由、协作和创新理念形成新的情报生产关系,联结更广大的人民,消除特定机构对情报的控制和封锁。
2.3 构建网络化情报结构
秘密情报工作习惯于单线联系,情报组织、处理和传播流程都是线性模式。开源情报改革了工作宗旨,扩大了情报范围,可以形成类似源代码社群的扁平化网络模式。
情报组织可以连接政府部门、非政府组织、企业、科研机构和智库等,形成开源情报组织群。情报处理流程不再是线性的搜集、预处理、分析、传播,而是将处理流程分割、打散,分成搜集、概念化、确认、描述、解释、扩展、预测、假设、识别、说明、建模、重新组织、研究、重新任务搜集、合成、文本可视化等模块,以更加自由的形态吸引人们加工情报,促进情报的横向流动,挖掘情报的深层次价值,同时也可以保持情报必要的秘密属性。情报传播模型可以结合互联网、社交网络,以随机网络、小世界网络和规则网络的形态传播情报。网络的目标不是形成自上而下的控制,而是创建一个松散的自下而上的开源情报社区,扩大开源情报的影响力,更大范围地发挥情报功效。
2.4 改进融合式情报方法
传统情报方法多是情报人员独立的逻辑思考判断和情报软件的运用,大数据容易造成信息淹没,仅凭人力无法处理海量数据。开源情报作为情报领域不多的开放平台,可以引入更多计算机、数学等方面的专家,以人工智能、云计算和大数据技术等方法提高数据处理的效果。同时将情报思想和理念融入情报分析工具中,帮助计算机、数学等理论和技术落地,增强情报科学的影响力,实现情报的价值。
融合式的情报方法将人员和技术、思想和行动相统一,促进了情报界、学术界、政界和商界之间的交流和互动,开源情报机构利用其独特的位置优势,成为情报整合、共享和协调的枢纽,不断吸收网络和其他领域的情报资源。网络化结构可以结合“旋转门”人员流动机制,使得不同领域的专家加入情报网络,提供专家智慧,传递情报观点,扩大开源情报影响力。
2.5 推动开源情报服务大众
情报的宗旨是服务决策,传统情报只服务于战争指挥者、企业经营者等特权阶级。正如开源运动是为了打破商业软件垄断一样,开源情报产品不应只是阶层的特别优待,其宗旨是服务更广大的人民,成为人们生活和工作中消除不确定性的决策辅助。
秘密情报产品大多服务于特殊阶级,开源情报产品服务范围更加广泛。《开源情报全球市场:按来源、技术和最终用户划分的机会分析和行业预测,2020—2027》中分析:开源情报的用户分为国家政府情报组织、军事和国防情报组织、网络安全组织、执法机构、金融机构、私营公司和普通大众,并且预测未来7年中,这7类用户的增长率均会超过25%[13]。开源情报不但为传统情报组织提供情报资源,而且为更广大的社会组织和人民提供情报服务。但是需要充分认识到,虽然信息来源公开,但是部分开源情报产品还是需要严格保密,由情报部门和政府部门控制传播,服务于特殊决策人群。
现代社会,情报的覆盖率比保密性更加重要,情报共享已经成为安全工作的保障[14]。在开源精神的引领下,开源情报合理运用其来源和方法的灵活性,解决信息爆炸困扰,成为情报发展路上的破冰利器;同时,开源情报与社会的联系更加紧密,可以充分发挥群体合力,改变情报刻板印象,提供更大范围的决策辅助作用。
3 开源精神对情报应用模型的革新
网络群体的聚集扩大了开源运动的受众,公众思维的解放推动了开源运动的发展。在竞争情报、安全情报和科技情报应用领域已经有了开源模式的深化。
竞争情报领域中,维基百科(Wikipedia)是典型的开源情报的开源协作模式产物。作为大众传媒,图书尤其是科普书籍习惯性地需要专家认证,才能“安全”地出版[15]。2001年,维基百科上线,采用了开放性的创新模式,网民可以自由查看和编辑词条内容。大众协作的模式改变了专家把关的百科全书生产过程[16],让异质共同体可以参与知识生产过程;以知识共享的模式改变出版商垄断的知识传播途径,让知识更易于获取。同开源运动一样,维基百科是对商业知识垄断的抗击。以西尔凡·奥鲁为代表的语言学家、编辑和图书出版商认为,百科全书需要封闭编辑,不可以任由非专家篡改内容[17]。但是维基百科通过自主参与、集体协作的方法消除了专家依赖,提供了准确的词条知识[18],甚至成为美国法院的审判依据[19]。作为开源模式的成功范例,维基百科以集体智慧营造社会认同感,通过群体关系形成知识网络,在竞争情报领域推动了情报的开源创新。
“9·11”事件之后,美国安全情报界进行了深刻反思,认识到开源情报对情报工作的重要性。2004年,中情局推出了中情局维基(CIA Wiki);2006年,国家情报局推出了情报维基社区(Intellipedia)[20],这两个网络社区项目允许专家研究和讨论情报产品,提高情报产品质量;鼓励人们提交信息,建立知识库来制作安全情报产品。但是为了保证安全,情报社区设置了3个开放等级,参与者必须将个人信息附加到情报产品中。之后,中情局又推出夏普计划(SHARP Program),邀请人类学、社会学、心理学专家和宗教学专家,与高级分析员们共同参加为期4周的情报会议,试图将外部智力引入情报生产过程[21]。美国情报部门希望在封闭系统中,构建安全情报的开源模式,减少工作成本,更加有效地运用外部智慧。
科技情报工作中以同行评议的方式引入开源模式。在科学界发展早期,因为没有绝对的权威,必须以建立共识的方法来确定文献的价值,这个过程中的核心部分就是同行评议,由业内人士根据专业知识和认知体系进行审核型观点建构,来评估彼此工作[22]。同行评议是开源社群中的基础活动,通过源代码解读、软件评测来审读软件优劣,并由此衍生出Linus定律:只要经过足够多的审查,任何错误都能浮现(Given Enough Eyeballs,All Bugs Are Shallow)。
作为集体协作模式,开源模式调动了广大人民的积极性,以群体化协同工作的方法,完成或完善一项工作。模式是解决问题的方法论,从理论高度凝练出经验与知识体系,而模型是连接理论与现实世界的桥梁,将元素、关系和方法实例化,便于操作。开源情报应用模型将开源模式运用到开源情报的处理过程中。目前,传统开源情报应用模型主要是线性模型和循环模型[23-24],只是普通情报处理模型的延展,并没有充分挖掘开源情报的特点。线性模型中,从确定计划开始,然后采集和分析信息形成情报,最后传播情报。循环模型则增加了反馈环节,根据反馈情况,改进采集、分析和传播模块,形成环状模型。本文借用开源运动中的成熟应用模型,构建了两种开源情报应用模型:Pull-Request开发模型和众包生产模型。Pull-Request开发模型是开源运动在计算机行业的原生模型,直观展现了计算机行业中的开源开发和协作;而众包生产模型则是开源运动在工业中的衍生模型,经过工业需要和流程的改造,有着较强的实践指导性。开源情报应用模型在原有模型基础上更加注重情报特点,充分发挥开源优势,实现情报人员的多元化和情报质量的高效化。
3.1 开源情报的Pull-Request开发模型
GitHub是一个开源软件项目托管平台。继Linux社区之后,GitHub平台成为程序员的重要集散地,是开源运动的标志性平台。截至2021年11月,GitHub平台上的开发者数量已达7 300万人。开发者在平台中,可以实时查看感兴趣的软件项目,提交代码修改意见,并自由地发表评论。GitHub平台使用了Pull-Request开发模式(以下简称PR开发模式)吸引用户共同完善软件项目[25]。PR开发模式分为6个步骤:
1)开发者找到感兴趣的软件项目仓库,可以关注(Follow)其他项目开发者,并查看(Watch)项目源代码。
2)克隆(Fork)该项目到本地,进行相应修改,包括修复Bug、增强性能,或者是增加功能。
3)开发者发起Pull-Request,将修改返回到原仓库。
4)类似于同行评议,项目内的所有开发者对修改的代码规范和质量等进行评价并给出意见。
5)开发者根据修改意见,完善并更新Pull-Request。
6)最后,项目负责人根据评价意见,决定是否将修改代码合并(Merge)到自己的项目中。
PR开发模式的精髓在于开发者的修改内容会被平台实时发送给项目的所有相关人员,刺激人们持续关注项目进程,增强了社群黏度。开发者和评议者的身份可以随时互换,这种“既做运动员又做裁判”的感觉吸引开发者不断投入时间和精力,而群体评议的制度可以有效维护公正。
开源情报的PR开发模型既要保持原有的开放特征,又要兼顾情报必要的保密属性。如图2所示,在原有的PR开发模型中增加了审核功能,由项目负责人审核开发者的身份,修改内容的安全性和保密性。
图2 开源情报的Pull-Request开发模型
开源情报的PR开发模型中,首先需要建立开源情报的初始社区,社区内分为科技、社科、军事、公安、竞争和卫生等情报类别;然后,在各个类别中,邀请情报工作人员和领域专家作为初始用户,提供情报项目,担当项目评审;最后,用户发布情报项目,经项目负责人审核情报保密性后,在平台传播。由此,形成了PR开发模型的初始用户、项目和评审。
开源情报的PR开发模型分为5个步骤:
1)感兴趣的开发者提出查看请求,项目负责人审核开发者身份。
2)审核通过后,开发者自动加入项目社群,开发者有权查看和下载情报项目到本地,提出项目修改意见(Pull-Request)。
3)评议者审核修改意见的准确性和价值。
4)负责人根据评议者们的意见,决定是否将开发者的修改加入情报项目。
5)流程顺利结束之后,开发者自动加入评议者社群,可以对其他开发者的修改进行评议。
开源情报的PR开发模型在保留原模型的开放和协作特色之外,增加了情报审核和资格审核步骤,保持情报产品秘密属性的同时,增加了情报辐射的范围,发挥了开源情报和开源精神的融合功效。以开放的平台吸引集体智力,以群体评议提高情报产品的质量,以社交化的交互增强社群的活力,实现开源情报服务大众决策的宗旨。同传统的开源情报应用模型相比,PR开发模式根植于实践工作中产生的应用模型,更具有操作性和实践指导性,而传统模型更多从理论层面畅想实践工作。同时,模型充分利用了群体的开发和审核能力,以项目成功感增加开发者的兴趣,使开发者成为开源情报社区的主导力量,增加了开源情报的协作性和传播性。
3.2 开源情报的众包生产模型
众包生产模型是指公司将任务以外包的形式,分发给自愿接受的大众[26]。这种模型整合了公共资源,降低了工作成本,以开放模式实现了资源的创新性利用。众包生产模式给了开源情报工作发展新的方向。
Stottlemyre S A研究发现,为服务国家安全决策,将众包生产模式和情报工作相结合,由团体中的成员自愿搜集、分析信息,效果良好[27]。常规情报模型以封闭性的单线联系为主,众包生产模型则以网络化开放和关联为主。本文在已有众包生产模式的基础上,结合了开源社区的3种管理模式:自发治理、内部治理和外部治理[28],设计了三层三阶段的开源情报的“双三”众包模型。
模型中的三层结构分别是:专家指导层、情报工作实施层和审核层。三阶段分别是:情报任务分发、发布和接受阶段。模型中的主体有专家、发包方、众包平台、接包方和审核平台。
专家指导层中,如图3所示,在情报任务分发阶段,专家帮助发包方合理分配情报任务,明确情报目标;在情报任务分布阶段,专家客观评定情报工作的价值,审定情报任务的完成情况;在情报任务接受阶段,专家给接包方提供技术指导,为情报任务的解决注入领域知识。
图3 开源情报的众包生产模型
情报工作实施层中,发包方、众包平台和接包方构成众包情报工作的循环。发包方将情报任务脱敏之后,划分为若干个任务,发送给合适的众包平台,最后明确情报任务;众包平台接受情报任务,将其整理包装后,发布在平台上;接包方选择合适的情报任务,完成情报任务之后提交解决方案;众包平台接受解决方案后,反馈给发包方,发包方确定任务完成情况,并将酬劳经众包平台转发给接包方。
审核层中,审核平台由保密部门和情报部门共同组成。在情报任务分发阶段,审核平台审查情报任务的脱敏情况;在情报任务发布阶段,审核平台查验众包平台的资质,鉴定情报任务和接包方提交的解决方案的密级;在情报任务接受阶段,审核平台查验接包方的资质。
开源情报的众包生产模型在保持原模型的合理分配资源和充分调动人员的特点之上,将简单的原模型根据情报需求和特点进行分层和分级改造。众包平台中,接包方自发选择任务,实现开源项目的自然发展;发包方进行内部管理,实施任务划分、方案审核等控制手段;审核平台和专家进行外部治理,保证情报的保密性和安全性。同传统的开源情报应用模型相比,众包生产模型更适合规模化的开源情报开发,以多层管理体系保证情报的妥善处理,通过大规模协作,建立可信、开放和共享的环境,更加顺畅地推动情报项目发展,促进情报共享,分享众人智力,使得情报需求方、情报管理方、民众、专家等职责明确,各尽其用。
情报界一直希望生产出全源情报(All Source Intelligence),开源情报的Pull-Request开发模型和众包生产模型为全源情报的产出做出了有益的尝试。在开源精神的指引下,两种模式参与门槛低,有着规范的贡献流程和透明的参与记录,以扁平化的工作结构鼓励大众进行情报协作,帮助大众迅速、及时和准确地做出决策。开源模型创造了“以用户为中心”的开源情报,减轻了情报机构的工作负担,增加了民众的情报使用和参与热情,成为将情报带入大众生活、服务大众生活的重要途径。
4 结 语
开源运动传递了网络世界向自由世界演进的精神力量,自由合作、平等共享和自由开放的开源精神可以帮助开源情报衍生出从理念、人员、流程和目标的全面变革,开源情报需要具备现代化的开放精神,以多元化的情报人员、更合理的网络化情报结构和融合式情报方法创新情报处理工作,使其服务于更广大的人民。由此开发的Pull-Request开发模型和众包生产模型适用于保密要求较低的情报产品,由大众参与情报全流程制作和传播,实现开源情报产品的高效生产,真正凸显开源特色。从情报的角度来说,开源情报更能发挥网络时代的大数据优势,实现情报合作和共享,成为人民的“耳目尖兵参谋”。
开源运动在互联网行业的发展是一脉相承的顺水推舟,但是在情报这一秘密行业,则需要特别的创新。开源运动和开源情报在概念上紧密联系,通过情报活动的协作性,使得开源情报从片面强调保密转变为合理开放的体系,以适应大数据带来的机遇和挑战。本文将开源精神和开源情报进行了有机融合,并构建了开源情报应用模型,从理论和实践角度探索了开源情报的深层次“开源化”,希望破除开源情报只是信息来源公开的情报这一古板定义,挖掘出开源情报更多的发展可能性。未来,开源精神和开源情报的融合还需要更多学者的努力,尤其在情报组织、法律和工作中促进开源精神和开源情报统一等方面,需要更多的探索。
致谢:感谢导师苏新宁教授对论文选题确定和论文修改的帮助!