国家文化数字化战略:技术路线与中心环节
2023-02-28高书生
高书生
【摘要】随着互联网、大数据、云计算、人工智能、区块链等新兴技术日益融入经济社会发展各领域全过程,我国从建设社会主义文化强国、厚植数字时代文化自信的高度,对国家文化数字化作出战略部署,以积极应对科技革命和产业变革给文化建设带来的机遇和挑战。国家文化数字化战略,旨在构建从文化资源到文化生产再到文化传播、文化消费的全新体系。实施国家文化数字化战略的出发点是发力供给侧、激活文化资源,实现文化生产体系现代化。各级各类文化机构是国家文化数字化战略的重要实施主体,在数字化转型过程中仍面临版权保护、数据安全、投入产出失衡等问题,构建国家文化专网、加强标识解析体系建设则是针对这些问题的技术解决方案。促进文化数字化生产力充分发展是实施国家文化数字化战略的中心环节,其中数据是核心生产要素,数据关联是核心生产力,应通过数据分类、编目、标签化,实现文化内容采集、加工、交易、分发、呈现全流程数据化,打通数据孤岛,实现数据关联,推动文化产业发展迈上新的台阶。
【关键词】文化数字化 国家文化大数据体系 文化数据 国家文化专网 数据关联
【中图分类号】G122 【文献标识码】A
【DOI】10.16619/j.cnki.rmltxsqy.2022.23.002
为繁荣发展文化事业和文化产业,推进文化自信自强,铸就社会主义文化新辉煌,党的二十大报告明确指出:“实施国家文化数字化战略,健全现代公共文化服务体系,创新实施文化惠民工程。健全现代文化产业体系和市场体系,实施重大文化产业项目带动战略。”本文拟就实施国家文化数字化战略的技术路线与中心环节进行探讨。
国家文化大数据体系是把握国家文化数字化战略的钥匙
近年来,互联网、大数据、云计算、人工智能、区块链等技术加速创新,日益融入经济社会发展各领域全过程。以习近平同志为核心的党中央站在统筹中华民族伟大复兴战略全局和世界百年未有之大变局的高度,把握数字化、网络化、智能化方向,部署加快新型基础设施建设,加强战略布局,推进数字产业化和产业数字化,抓住世界科技革命和产业变革的先机,抢占未来产业竞争的制高点。
为应对科技革命和产业变革给文化建设带来的机遇和挑战,2020年,党的十九届五中全会作出了推动公共文化数字化建设、实施文化产业数字化战略的决策部署。2022年5月,中共中央办公厅、国务院办公厅印发了《关于推进实施国家文化数字化战略的意见》(以下简称《意见》),《意见》明确,到“十四五”时期末,基本建成文化数字化基础设施和服务平台,基本贯通各类文化机构的数据中心,基本完成文化产业数字化布局,公共文化数字化建设跃上新台阶,形成线上线下融合互动、立体覆盖的文化服务供给体系;到2035年,建成物理分布、逻辑关联、快速链接、高效搜索、全面共享、重点集成的国家文化大数据体系,文化数字化生产力快速发展,中华文化全景呈现,中华文化数字化成果全民共享、优秀创新成果享誉海内外。
把握国家文化数字化战略的精髓,国家文化大数据体系是一把钥匙。《意见》为实施国家文化数字化战略指明了前进方向,规划了实施路径,在指导思想部分明确以国家文化大数据体系建设为抓手,在主要目标部分确定到2035年建成国家文化大数据体系。《意见》提出了八项重点任务,其中第一项是“关联形成中华文化数据库”,即统筹利用文化领域已建或在建数字化工程和数据库所形成的成果,全面梳理中华文化资源,推动文化资源科学分类和规范标识,按照统一标准关联零散的文化资源数据,关联思想理论、文化旅游、文物、新闻出版、电影、广播电视、网络文化文艺等不同领域的文化资源数据,关联文字、音频、视频等不同形态的文化资源数据,关联文化数据源和文化实体,形成中华文化数据库。
国家文化大数据体系在架构上可概括为“两侧四端”,“两侧”分别是供给侧、需求侧。所谓需求侧文化大数据,是指在文化消费过程中所產生的数据;而所谓供给侧文化大数据,就是从文化资源中“萃取”的数据。显然,中华文化数据库中的“大数据”,在性质上是属于供给侧的,是来源于文化资源的数据,是将中华民族积淀了五千多年的文化资源,转化为文化生产要素,使其成为文化创新创造的素材和源泉,并从中提取具有历史传承价值的中华文化元素、符号和标识,丰富中华民族文化基因的当代表达,全景式呈现中华文化。这是国家文化大数据体系的本质特征。
“四端”分别是资源端、生产端、消费端和云端。资源端是指公共文化资源收藏或保管机构,既包括博物馆、图书馆、美术馆、文化馆、档案馆、资料馆等公益性文化事业单位,也包括广播电台电视台、报刊社、出版社、文艺院团等文化生产机构。生产端是指对文化资源数据进行采集、加工、生产的机构。生产端和资源端可能是重叠的,即作为公共文化资源的机构,同时从事文化资源数据的采集、加工、生产;生产端和资源端也可以是分离的,一些并不拥有公共文化资源的机构或个人,也可以从事文化资源数据的采集、加工、生产。消费端是指文化消费场所或机构。《意见》将线下文化消费场所分为两类,一类是新时代文明实践中心、学校、公共图书馆、文化馆、博物馆、美术馆、影剧院、新华书店、农家书屋等文化教育设施;另一类是旅游服务场所、社区、购物中心、城市广场、商业街区、机场车站等公共场所。云端是指服务于文化资源数据的存储、传输、交易和文化数字内容分发的机构,包括文化数据服务中心和文化数据服务平台两类。
根据上述国家文化大数据体系架构,可以用一张图来直观呈现《意见》提出的重点任务。如图1所示,实施国家文化数字化战略,旨在构建从文化资源到文化生产再到文化传播、文化消费的全新体系。实施国家文化数字化战略的出发点,概括地说就是发力供给侧、激活文化资源,实现文化生产体系现代化。
实施国家文化数字化战略的技术路线
国家文化数字化战略的实施主体,应当是法人机构和公民个人,特别是各级各类文化机构。推进实施国家文化数字化战略,必须坚持问题导向,即针对文化机构的疑虑提出相应的对策。
早在2011年,中共中央办公厅、国务院办公厅印发的《国家“十二五”时期文化改革发展规划纲要》就已明确提出“实施文化数字化建设工程”,即对文化资源、文化生产和文化传播实施全面数字化。文化机构对文化数字化都持开放态度,认为这是大势所趋,特别是突如其来的新冠肺炎疫情导致线下文化活动基本停摆,线上文化消费需求“井喷式”增长,文化机构深切体会到错过数字化就会被边缘化甚至被淘汰。
对跨越“数字鸿沟”,文化机构存在以下担忧。一是盗版问题,即如何保护数字版权。二是数据安全,文化数据属于国家、民族的核心信息资源,特别是文化基因数据,其地位同生物基因数据一样重要,确保数据安全是第一位的。三是投入产出失衡,这些年一些文化机构积极探索数字化转型升级,取得了一定成效,但始终没有解决“两张皮”问题,即数字化新业务同传统业务未能有效融合,特别是新业务尚未实现盈亏平衡。
为解除文化机构的后顾之忧,《意见》给出了技术解决方案:一是形成国家文化专网;二是加强标识解析体系建设。
关于国家文化专网,《意见》从基础设施、建设主体、接入服务、数据管理四个方面作出了安排。其一,依托现有有线电视网络设施、广电5G网络和互联互通平台,形成国家文化专网。其二,鼓励多元主体依托国家文化专网,共同搭建文化数据服务平台。其三,鼓励和支持文化旅游、文物、新闻出版、电影、广播电视、网络文化文艺等领域的各类文化机构接入国家文化专网,利用文化数据服务平台,探索数字化转型升级的有效途径。其四,发挥好国家文化专网网关物理隔离作用,对数据共享、关联、重构等主体实行准入管理。
国家文化专网的功能主要包括四个方面。一是接入服务,即各级广电网络公司把各级各类文化机构都接入国家文化专网,在一个闭环系统中汇集、加工文化资源数据。二是存储服务,即各级广电网络公司为文化机构的数据存储提供服务器租赁服务。三是算力服务,即在国家文化大数据体系的区域中心建设具备云计算能力和超算能力的文化计算体系,构建一体化算力服务体系。四是分发服务,即各级广电网络公司链通各级各类文化消费场所,并与互联网消费平台衔接,通过多网多终端分发文化数字内容。
上述四项服务都是依托现有设施提供的,避免了重复建设。接入服务是利用广电网络公司现有的光纤资源,为百万家文化机构提供服务。储存服务主要为不具备建设数据中心能力的中小文化机构提供,目前已有广电网络公司研制出一体化机柜,价格适中,可在全国范围内推广。算力服务目前可利用部分广电网络上市公司已建成的大型数据中心进行部署。分发服务更是广电网络公司的优势,就是将文化数字化成果分发到学校、公共文化机构、影剧院、旅游景区、社区、购物中心、商业街区、机场车站等,为广电网络公司开辟广阔的业务空间。
关于标识解析体系,《意见》从底层部署、基础设施、建设主体、技术创新、标准推广五个方面作出了安排:其一,依托信息与文献相关国际标准,在文化机构数据中心部署底层关联服务引擎和应用软件;其二,依托现有有线电视網络设施、广电5G网络和互联互通平台,部署提供标识编码注册登记和解析服务的技术系统;其三,鼓励多元主体依托国家文化专网,共同搭建文化数据服务平台,提供文化资源数据和文化数字内容的标识解析、搜索查询、匹配交易、结算支付等服务;其四,文化产权交易机构要充分发挥在场、在线交易平台优势,推动标识解析与区块链、大数据等技术融合创新;其五,加强标识解析体系建设,推广信息与文献相关国际标准。其中两次提到的“信息与文献相关国际标准”,是指由我国提案、国际标准化组织正式发布的《ISO17316-2015 信息与文献国际标准关联标识符》(ISLI),该项国际标准的国际注册机构(ISLI Registration Authority, ISLI RA)设在我国香港特别行政区,底层技术系统提供商为设在我国境内的公司。
国家文化专网是依托现有的有线广播电视网络设施而形成的,不是重复建设;而依托我国主导的信息与文献国际标准关联标识符,部署提供标识编码注册登记和解析服务的技术系统,即形成了国家文化专网标识解析体系。部署了底层关联服务引擎和应用软件的各类机构和个人,只要接入国家文化专网,就可以对数据进行标识、关联,被标识和关联的数据在国家文化专网将畅通无阻。
标识编码是标识解析的基础。所谓标识编码,就是给每一个数据分配唯一可读的标识符,这个标识符类似于“身份证”。迄今为止,国际标准化组织在信息与文献领域发布了12项标识符国际标准。在ISLI发布之前,国际信息与文献领域原有的10项标识符(ISBN、ISSN、ISRC、ISMN、ISWC、ISTC、ISAN、ISNI、DOI、ISCI),都是针对不同属性单一资源的标识符。与其他标识符不同的是,ISLI并不标识一个单一的实体对象,而是标识两个实体之间的关联关系,不改变实体的各种属性和标识。《意见》提出全面梳理中华文化资源,推动文化资源科学分类和规范标识,按照统一标准关联形成中华文化数据库,这个“统一标准”,就是依托我国提出并主导的国际标准ISLI,但不替代各个行业正在执行的其他标识标准。
一条专网、一款标识符,构成了实施国家文化数字化战略的技术路线。各级各类文化机构按照物理分布、逻辑关联原则,在国家文化专网这一闭环系统中可以顺畅地完成数据的采集、加工、存储、传输、交易和分发,数据安全得到有效保障。
为进一步打消文化机构的顾虑,《意见》在保障措施中专门提出“加强文化数字化全链条监管”的要求,具体来说:一是在数据采集加工、交易分发、传输存储、数据治理等环节,制定文化数据安全标准;二是强化中华文化数据库数据入库标准,发挥好国家文化专网网关物理隔离作用,对数据共享、关联、重构等主体实行准入管理;三是完善文化资源数据和文化数字内容的产权保护措施;四是加强文化消费新场景一体化监管,确保进入传播或消费渠道的内容可管可控。
实施国家文化数字化战略的中心环节
互联网将消费推向了极致,催生了一系列消费新模式、新方式和新业态,数字化则把生产推向了新高度,引发生产方式革命性变革,创造了生产力的新形态——数字化生产力。促进文化数字化生产力充分发展,是实施国家文化数字化战略的中心环节。
党的十八大以来,以习近平同志为核心的党中央高度重视发展数字经济,将其上升为国家战略,极大地推动了数字经济的快速发展。从2012年至2021年,我国数字经济规模从11万亿元增长至超45万亿元,数字经济占国内生产总值比重由21.6%提升至39.8%。[1]数字经济时代,数据是重要的生产要素,也是国家基础性战略资源。2020年4月,中共中央、国务院发布的《关于构建更加完善的要素市场化配置体制机制的意见》,将数据同土地、劳动力、资本、技术等生产要素并列,强调通过加快数据要素市场培育,充分发挥数据要素对其他要素效率的倍增作用,使大数据成为推动高质量发展的新动能。
我国是文明古国,也是文化资源大国。新中国成立以来,国家已组织开展多次全国性文化资源普查,形成了海量文化资源数据。2012年至2016年,国务院统一部署开展了第一次全国可移动文物普查,全国共登录珍贵文物3,856,268件,其中一级文物218,911件,二级文物551,192件,三级文物3,086,165件。登录文物照片5000万张,数据总量超过140TB。[2]2013年至2016年,原文化部开展全国美术馆藏品普查,藏品涵盖绘画、书法篆刻、雕塑、工艺美术、设计艺术、民间美术等各种类型的美术作品,藏品实物数量592,663件,藏品图片820,288幅,数据总量6.9TB。[3]2015年至2017年,原文化部在全国范围内开展了地方戏曲剧种普查,普查出348个戏曲剧种,组织编写《中国戏曲剧种全集》,共计350册。组织建设民族音乐数据库,已收集音频资料10万余段、视频资料3000余条、乐谱2万余册、书籍7000余本、论文3万余篇,内容涉及民族音乐领域代表性乐曲、乐谱、乐团、乐人、乐事和民族音乐理论研究的学术成果。[4]
除上述全国性文化资源普查数据,报刊社、广播电台、电视台等新闻单位拥有媒资库,文化馆、档案馆、出版社、电影制片厂、文艺院团等文化机构也都拥有自己的数据库,这些数据库各具特色、弥足珍贵,诸如中国民族民间文艺基础资源数据库、中华老唱片数字资源库、国家舞台艺术音像库、中国生物志库、中国地方历史文献数据库、延安时期文献档案数据库、海外藏中国民俗文化珍稀文献库、中华石刻数据库等,包含大量红色经典影像、珍贵历史材料、优秀科普资料等内容。
文化机构特别是负责收藏和保管公共文化资源的机构,虽然拥有海量文化资源数据,犹如坐在金山上,但是由于没有将这些资源关联起来,每个机构都守护着一个数据孤岛,无法体现数据的文化价值。如果文化机构都接入国家文化专网,进入国家文化大数据体系,关联文化资源数据,延展文化数据供应链,运用数字化手段创新表现形态、丰富数字内容,推动图书、报刊、电影、广播电视、演艺等传统业态升级,推动中华文化瑰宝活起来,就可以在文化数据采集、加工、交易、分发、呈现等领域,造就一大批新型文化企业,推动文化产业发展跃上新台阶。
世界因互联而多彩,数据因关联而增值。数据的价值就在于其描述或表达的文化内涵。进行数据关联,要找准数据所在的坐标系。一是要对文化数据进行科学分类,分类标准可参照联合国教科文组织的文化统计框架,将数据划分为六大类别,即文化和自然遗产、表演和节庆活动、视觉艺术和手工艺、书籍和报刊、视听(音像)和交互媒体、设计和创意服务;二是按照专业性的知识图谱进行编目,确定每个数据的方位;三是对文化资源数据的特征进行描述并进行数据标签化。如同无人驾驶汽车需要海量關联数据支撑,百度等数据技术公司集中大量的人力对交通数据进行标注一样,可以预见在不远的将来,文化行业也会出现数据关联的车间或基地,成千上万的年轻人将加入文化数据关联行业,数据关联将成为新职业。
如果说数据关联是生产过程,那么,关联数据就是产出成果。实施国家文化数字化战略,各级各类文化机构都应将数据关联纳入经常性工作,对本单位的数据加以标识和标注,形成关联链,这是内关联;其他单位亦对新产生的数据进行标识和标注,对已形成的关联链进行再标识和标注,并通过国家文化专网形成更大范围的关联链,这是外关联。未来的文化数据或许将以关联链面目出现,关联链将成为文化机构的新业态,客户可通过购买关联链访问不同文化机构的数据库,无论建设数据库还是生产关联链,都能够获得收益,那种只投入不产出的局面将被改变。为了让关联数据的变现收益在分配上体现多劳多得,就需要为每个关联数据发放“身份证”,即前面提到的标识符,它不仅能在文化资源数据的元数据中标注著作权人,标明关联数据的归属主体,而且将终身伴随着数据流转,在底层技术上保护版权。
结语
国家文化数字化战略,旨在构建从文化资源到文化生产再到文化传播、文化消费的全新体系。国家文化大数据体系是把握国家文化数字化战略精髓的一把钥匙。实施国家文化数字化战略的出发点,是发力供给侧、激活文化资源,实现文化生产体系现代化。各级各类文化机构是国家文化数字化战略的重要实施主体,推动文化机构积极开展数字化转型,必须探索形成国家文化专网、加强标识解析体系建设的技术解决方案,以消除文化机构在实践中的担忧。促进文化数字化生产力充分发展,是实施国家文化数字化战略的中心环节。数据是核心生产要素,数据因关联而增值,数据关联是核心生产力,关联数据是核心资产,数据变现是核心驱动力,数据安全是核心竞争力,生产网、生产线、生产端是核心环节。这些共同构成了国家文化数字化战略的核心要素。应通过数据分类、编目、标签化,实现文化内容采集、加工、交易、分发、呈现全流程数据化,打通数据孤岛,实现文化数据内外关联,推动文化产业发展迈上新的台阶。
注释
[1]《中国数字经济规模超45万亿元》,《人民日报·海外版》,2022年7月6日,第8版。
[2]国务院第一次全国可移动文物普查领导小组办公室、国家文物局:《第一次全国可移动文物普查工作报告》,2017年4月7日,http://www.ncha.gov.cn/art/2017/4/7/art_1984_139379.html。
[3]全国美术馆藏品普查工作办公室:《全国美术馆藏品普查工作简报(第六十一期)》,2018年12月27日,http://ccamc.mct.gov.cn/pcb/tongzjb/201812/2fdb3b8e29464b7fa2ba364721292a70.shtml。
[4]《文化和旅游部关于政协十三届全国委员会第三次会议第2361号(文化宣传类125号)提案答复的函》,2020年9月24日,https://zwgk.mct.gov.cn/zfxxgkml/zhgl/jytadf/202012/t20201204_907077.html。
责 编/陈璐颖