数据要素×出版:出版数据要素乘数效应分析*∗
2024-11-06辛谏李翠玲
摘 要:出版供给侧的数据要素溢出效应由裂变效应、聚合效应、生成效应及渗透效应构成。内容资源裂变、数据模态裂变、数据产品裂变是出版数据要素裂变效应的基本内涵;异质多模态数据资源聚合、电子书向数字图书馆的聚合、条目数据集聚及出版数据语料库—出版大数据—出版大模型的聚合形成了出版数据要素的聚合效应;基于模板、规则、群体智能及大模型的人工智能生成内容,加速形成了出版数据要素的生成效应;出版数据要素与劳动要素、资本要素、技术要素、管理要素相互之间的渗透、协同、融合、替代共同诠释着出版数据要素的渗透效应。出版数据要素的裂变效应、聚合效应、生成效应是“数据×”发挥出版数据要素乘数效应,出版数据要素的渗透效应则是“要素×”发挥出版数据要素乘数效应,前者往往是数据自身发挥乘数效应并创造价值,后者则是数据与其他要素融合发挥乘数效应并创造价值,二者具有一体两面的关系。
关键词:数据出版;出版数据要素;数据要素乘数效应;裂变效应;聚合效应;生成效应;渗透效应
DOI: 10.3969/j.issn.2097-1869.2024.04.006 文献标识码:A
著录格式:辛谏,李翠玲.数据要素×出版:出版数据要素乘数效应分析:基于出版供给侧的视角[J].数字出版研究,2024,3(4):49-57.
多年来,通过推进数字化转型升级和出版融合发展,出版业先后开展了基础设施数字化、内容资源数字化和运营平台数字化工程,积累了丰富的内容数据资源、用户数据资源和交互数据资源。数据是新生产要素,是数字化、数据化、智能化的基础,已深刻融入生产、分配、消费、社会管理等环节,变革着生产、生活和社会治理方式。随着数据成为与土地、劳动力、资本、知识、技术、管理并驾齐驱的“七大生产要素”,数据要素研究的重要性和紧迫性日益凸显,数据作为关键生产要素在出版业高质量发展中将发挥显著的乘数效应。
1 出版业数据要素乘数效应的科学内涵
乘数效应(Multiplier Effect)是英国经济学家约翰·梅纳德·凯恩斯(John Maynard Keynes)提出的一种宏观经济效应,指经济活动中某一变量的增减所引起的最终变量变化的连锁反应程度[1],如政府支出乘数效应、货币乘数效应等。乘数效应产生的过程是:某变量发生初始变化,引发溢出效应进而导致其他变量发生变化,由此产生反馈效应再引起初始变量变化,周而复始地继续产生溢出效应和反馈效应,在二者叠加下,最终变量的变化比例高于初始变量的变化比例[2]。具体到生产要素领域,任诗婷等[3]提出,“数据要素的乘数效应是指数据要素的开发利用水平引起经济总产出变化的连锁反应程度”。其量化方式为:
数据要素的乘数效应=Δ(经济总产出)/Δ(数据要素开发利用水平)
具体到出版数据要素的乘数效应,可以分为溢出效应和反馈效应两种。出版数据要素乘数效应,则是“从出版数据叠加走向数据融合,通过不同类型、不同维度、不同模态的出版数据聚合,借助数智技术赋能,推动量变式发展走向质变式发展”[4]。出版数据要素的溢出效应体现了出版数据要素的开发和利用将引起供给侧、需求侧、供需匹配及管理服务(出版治理)方面相关变量的变化。在供给侧或生产端,出版数据要素的溢出效应具体可分为裂变效应、聚合效应、生成效应和渗透效应这四种类型(见图1)。受限于篇幅,本文不再详细阐述出版数据要素的反馈效应。
张新新等[4]曾分析出版业数智化技术赋能所带来的加数效应和数据化转型所引起的乘数效应,并简要介绍了出版数据乘数效应的裂变效应、聚合效应、生成效应。本文进一步对出版业数据要素乘数效应的裂变效应、聚合效应、生成效应及渗透效应进行分析。出版数据要素的裂变、聚合和生成效应基于数据要素自身发挥乘数效应的视角,而出版数据要素的渗透效应则基于出版数据要素与其他要素融合以发挥乘数效应的视角。
裂变、聚合、生成效应提出的政策依据为《“数据要素×”三年行动计划(2024—2026年)》(以下简称《行动计划》),其提出数据要素具有“放大、叠加、倍增作用”,须“充分发挥数据要素乘数效应,赋能经济社会发展”。结合出版业10余年的数字化转型升级和实践经验,出版业数据要素的“放大”对应“裂变效应”,“叠加”对应“聚合效应”,“倍增”对应“生成效应”。具体而言:(1)出版数据资源的放大推动裂变效应的产生。早在资源数字化阶段,出版单位就致力于对已有的存量数据资源、在制出版数据资源进行数字化拆分,“拆得进、取得出、拆得开”[5]是当时推动数据资源管理系统构建的基本准则,这种基于图书资源的数字化拆分,在量级上实现了“1变N,少变多,小变大”的出版内容数据资源裂变效应;(2)出版数据资源的叠加推动聚合效应的产生。“组得好、可复用”原则也是出版资源数字化管理系统构建的基本原则。前述拆分的出版内容数据资源,基于知识体系的标引、关联和计算,又分别投入到各种数据库建设中,如法信大数据平台、“智汇三农”农业专业知识服务平台、皮书数据库及各种专业知识资源数据等。应该说,各种专业资源数据库的建设和应用,是资源数字化转型升级的重要成果,是出版数据资源叠加产生聚合效应的典型体现;(3)出版数据资源的倍增推动生成效应的出现。随着出版大数据、大模型(如中国知网华知大模型、法信团队在研法律知识服务大模型产品)的出现,用户的提问、关键词输入会新增大量的数据资源,包括文本、音频和视频等,实现出版数据资源的几何式增长,这同时也是数智技术推动出版数据资源生成效应的主要体现。
同时,关于乘数效应和裂变、聚合、生成效应的关系,也存在着类似的表述和判断。吴忠民[6]指出“现代化的乘数效应和凯恩斯等经济学家所说的‘乘数现象’不同(限于经济领域但对现代化乘数效应在思路上有启发意义)。重要领域的现代化因素汇聚、叠加、整合在一起,从而生成一种巨大的、联动的、远远超出数量简单相加的聚合效应”。
2 出版数据要素的裂变效应:出版数据要素的放大作用
裂变效应,是指数据作为出版业关键要素被投入到生产经营过程,所引起的出版业数据资源、产品类型、产品数量发生“由小变大、由少变多”的几何式增长的效果。出版数据要素裂变效应主要体现在内容资源裂变、数据模态裂变和数据产品裂变三个方面。
2.1 内容资源裂变
内容资源裂变,是指数据要素被引入以后,确立数据思维、形成数据理念,原有的基于单本书、电子书为单位的内容资源,扩展为条目数据、知识点、词汇,甚至是单独的字均可成为资源单位。由此,拥有数千至数十万种图书、期刊、音像出版物的出版单位,其内容资源将扩展至数百万、数千万乃至数亿个单位。例如人民法院出版社年出书品种数千种,但旗下的法信数据平台倾力建设法律数据资源,通过法律图书数字化拆分、外部法律数据资源购置及主管部门法律文件数据化加工等方式;经过10余年的建设,平台目前拥有的可供运营和收入的“案例达到1.4亿篇以上,法律论文达到70万篇,法律观点达到30万条以上,裁判规则22万条以上”[7]。与此同时,上述内容资源的社会效益和经济效益均收获良好,数字化、数据化收入达到近8 000万元(人民币),利润率达到50%以上。
2.2 数据模态裂变
在数据科学领域,模态是指“数据不同的存在形式或信息来源”[8],一般包含文本、图片、音频、视频、3D模型及混合数据等。两种及以上模态的数据被称为多模态数据。随着对数据和数据要素的认知不断深化和全面,出版业不仅关注文本数据,更向着多模态数据的方向构建数据内容资源库。数据模态裂变,是指不同模态的出版数据要素类型被引入以后,可以通过数据要素之间的融合裂变出新的数据和新的数据模态,从而进一步扩大出版业的数据规模、丰富其数据模态类型。譬如,文本数据与音频数据的融合,为出版视频数据的生成奠定了基础;又如,出版营销数据、出版物基本信息、出版内容等多文本数据的分析与挖掘一方面能够输出新的文本数据,另一方面又可以通过可视化处理进一步转换为图像数据。当前,多模态数据资源建设成为出版单位的重要任务,是事关出版数据要素乘数效应发挥的关键因素之一。数据模态的裂变,意味着出版单位供给数据产品的类型进一步丰富,提供数据服务的能力进一步增强,出版单位由单模态数据服务商逐步转为多模态数据服务商、全媒体数据服务商,更好地满足用户的个性化、数据化、高品位的精神文化需要。
2.3 数据产品裂变
数据产品裂变,是指基于数据要素的驱动,出版单位所提供的出版数据产品单位更加精细化,产品类型更加丰富,产品数量几何式增长,产品规模更加庞大。包括创新性地研发数据出版产品,丰富数据出版产品类型,创新数据出版产品形态,从以基于原版原式纸书的电子图书和基于纸书碎片化的知识条目数据为主的数字出版产品,进一步拓展至革命性重构的数据出版产品——数据集、数据库、知识库、出版大数据、出版垂直大模型等。
就产品单位而言,数据要素的深度开发利用,推动着出版单位开发更加浓缩、精细、聚焦的产品单位,一改之前以“图书”“电子书”为量级的产品单位,转为以“篇”“章”“节”“段”“句”,甚至是“词”“字”为一个出版数据产品单位。“新华字典”App数据产品就是一个典型案例,《新华字典》图书和电子书本是一种产品,但经过深度数据加工和处理,辅以配音和解说,“新华字典”App将13 000多个汉字转换为13 000多种数据产品单位,收获了数千万用户、年产值达数千万元的经营成效。数据产品单位的精细化、浓缩化、聚焦化,深刻影响着出版业商业模式和盈利模式的转型,推动出版单位由“种册件”盈利模式转为“片章节”的盈利模式。
就产品类型而言,多源内容、异质数据及多形态数智技术的赋能,推动着多领域、多类型、多模态数据出版产品不断涌现,持续促进数据出版新业态的可持续和高质量发展。数据出版产品包括单一型的数据产品和集合型的数据出版产品,前者如“字”“词”“单本电子书”“单条数据产品”,后者如知识库、专题数据库、数字图书馆、大数据知识服务平台等。数据出版产品还包括单模态数据产品和多模态数据产品,前者如电子书、知识条目等,后者如数字教材、VR/AR出版物、富媒体电子书等。基于不同内容类型,专业数据出版产品、教育数据出版产品及大众数据出版产品等不断涌现,如法信知识服务平台、皮书数据库,高等教育出版社的“爱课程”“高教考试在线”及热销畅销的网络文学、网络小说等。出版数据要素渗透、融合多形态的数智技术,涌现出多维数智赋能的数据出版产品服务,如基于二维码技术的指数融合出版物、基于大模型技术赋能的出版垂直领域大模型(如律商联讯研发的Lexis+ AI™法律知识服务大模型)等。
就产品数量和规模而言,“传统出版业将每一本书作为一个产品、一个数据单元加以销售,每本书动辄包含二三十万字,从数据价值的角度来说,是一种较大的浪费”[9]。如前所述,数据内容资源的裂变,辅以多元化数智技术的赋能,必然催生出海量的、超大数据规模的数据出版产品。
裂变效应是出版数据要素乘数效应的前提和基础。唯有数据内容资源、出版数据模态、数据出版产品发生裂变,才可能引起后续出版数据要素的聚合、生成和渗透效应,才能在深层次推导和形成出版数据要素的溢出效应和反馈效应。
3 出版数据要素的聚合效应:出版数据要素的叠加作用
聚合效应,是指随着数据要素开发利用的程度逐步加深,出版业在知识体系的驱动下逐渐形成数据资源、数据产品、数据资产等集中的现象。出版数据要素聚合效应出现的原因,一方面是数据要素开发、利用程度不断加深,数据资源数字化、碎片化、裂变化到一定程度,则会上升到第二阶段——聚合阶段;另一方面,聚合效应的实现更是知识体系引领和驱动的结果。知识体系是数据资源集聚的内在依据和指引,出版数据要素乘数效应无论发挥哪种效应,均离不开知识体系的内在规制和作用:数据资源裂变需要依据知识体系进行拆分,而数据资源聚合则需要依据知识体系进行聚拢和归类,数据要素渗透其他要素,也是基于信息、知识的机理和规律进行渗透和融合,即便是人工智能生成数据,也需要发现知识元之间的逻辑关系(即知识体系的核心内容),形成思维链并实现内容的复杂推理。
具体而言,出版数据要素聚合效应体现在如下几个方面:
第一,异质多模态数据资源聚合。出版数据要素聚合的整体趋势表现为异质多模态数据资源的集聚,首先是内容数据资源的文本、音频、视频、3D模型、AR/VR及混合数据,基于知识体系的标引和计算,经过集聚形成海量、大规模数据服务平台或系统;其次是用户数据、交互数据围绕内容数据资源的开发利用,汇聚于出版业数据产品的研发、应用和运营过程,服务于数据出版和融合出版;最后是时间维度上的“存量数据资源、在制数据资源和增量数据资源”[10]及空间维度上的内部数据资源和外部数据资源进行汇聚,共同形成出版数据要素的溢出效应,实现规模报酬递增。
第二,由数字图书、数字期刊、数字报纸向数字图书馆、数字期刊库、数字报纸库的汇聚。电子书是出版业进行数字化转型、数据化升级初期阶段所研发的数据产品,包括基于纸质图书的原版原式电子书及不依托于传统出版、直接进行数字化生产制作的电子书。电子书主要依托B2C的商业模式实现盈利,早期较难被编辑、读者所接受,也难以实现规模化的经济效益。由此,电子书向数字图书馆或者说单一型数据产品向集合型数据产品的集聚态势开始显现。电子书是构成数字图书馆的主要组成部分和要素,大部分出版机构都沿着从电子书到数字图书馆的数据化产品路线前进。同理,期刊出版单位可通过对期刊数字资源进行存量资源转化、在制资源建设和增强资源购置等方式来实现数字期刊内容及数字期刊库的聚合;报纸出版单位可对历年报纸内容进行数字化建设来实现由数字报纸到数字报纸数据库的聚合。
第三,条目数据集聚。条目数据,是指对数字书报刊基于知识体系进行碎片化拆分形成的数据。出版单位内容资源的碎片化,是在纸质书报刊数字化的基础上发挥出版数据要素裂变效应的结果,同时又是形成出版数据要素聚合效应的前提。知识库、专题数据库本身就是以条目数据为基本构成单元、以大规模或超大规模数据资源集聚为表现形态的数据出版产品,是出版数据要素聚合效应的体现。出版单位条目数据集聚的技术路线往往遵循“数据条—数据集—数据库”的基本逻辑,有助于形成专业特色鲜明、内容优势突出的知识库、专题数据库等数据出版产品。
第四,出版数据语料库—出版大数据—出版大模型的聚合。依据上述异质多模态数据资源聚合的效应和趋势,在数字图书馆、条目数据集聚效应的综合作用下,有条件、有实力的头部出版单位可进一步发挥多源、多学科、多领域跨模态数据资源聚合效应,沿着超大规模出版数据语料库构建、出版大数据建设的路线,直至最终构建出版垂直领域大模型,提供数据生成、知识生成等业务,推动个体或群体主导的智慧驱动知识生产向人工智能主导的数据驱动知识生产传播的范式演进和升级。
综上,聚合效应是出版数据裂变效应的进一步延伸,出版数据资源裂变实现了资源级、产品级、模态级的几何式增长,而出版数据资源聚合则进一步推动数据出版产品类型、形态和模式的创新,为出版数据要素乘数效应的发挥起到坚实的助推作用。
4 出版数据要素的生成效应:出版数据要素的倍增作用
生成效应,是指在出版数据要素充分开发、利用的基础上,结合生成式人工智能技术的赋能,逐步出现数据生成数据、数据生成知识、生成巨量数据的现象。进一步说,出版数据要素的生成效应,是指基于“海量无标注的出版数据和高质量人工标注的出版数据、人类反馈的强化学习算法”[11]、文本大模型、视频大模型及相应的算力支持,所产生的智能生成文本、图片、音频及视频等效果数据和知识。现从数据要素生成效应的视角,进一步系统梳理和总结数据要素如何与生成式人工智能结合来生成数据、知识及数据产品。
ChatGPT掀起了基于数据、算法和算力生成文本数据、图片数据的热潮,而Sora则进一步催生大模型生成视频数据的热潮。一直以来,对人工智能生成内容(Artificial Intelligence Generated Content,AIGC)的技术原理、应用场景、挑战与对策,及其所引发的著作权、伦理、价值观等问题关注较多,但鲜有对生成内容性质的分析。AIGC的“C(Content)”究竟是什么?从出版业视角来看,除了要关注其具备生成文本、图片、音频、视频等多模态内容以外,更需要思考其生成内容的性质是数据、信息还是知识。
首先,AIGC的技术原理包含数据、算法和算力三部分,数据的重要性置于第一位。“在AI三要素之中,数据代表着生产要素或生产资料,算法意味着新的生产关系,算力则表征着新的生产力。”[12]如果没有超大规模的数据语料,再先进的算法、再巨大的算力,也无法实现人工智能生成效应。须知算法的研发、优化、迭代和应用都离不开大量数据语料的“喂养”和训练,正是巨量无标注文本数据和高质量的有标注文本数据,构成了文本、图片、音视频数据生成的母体和本体。
其次,AIGC不同的技术路线导致其生成内容分别成为数据、信息或知识。AIGC的技术路线大致分为“基于模板的AIGC、基于群体智能的AIGC、基于规则的AIGC以及基于大模型的AIGC”[13]。其中,基于模板的AIGC,代表性产品为新闻机器人或撰稿机器人,其内容性质多为信息或数据,基本工作原理是清洗和梳理资讯数据,构建新闻信息语料库,训练语料并形成深度学习模型,通过抓取新闻时间关键要素,筛选语言模板,填充关键数据,形成新闻稿件。基于群体智能的AIGC属于知识性质、知识要素的范畴,维基百科是代表性产品,其通过非线性、去中心化、大规模协作的群体智慧方法,对结构化和半结构化数据进行知识抽取,形成各专业领域本体,并生成基于元数据的专题性数据库。基于规则的AIGC,典型产品为微软“小冰”,其属于情感智能的范畴,生成内容大多属于知识性质,其除了出版书籍《阳光失了玻璃窗》等之外,更是建立了国内规模首屈一指的金融文本摘要平台,为国内个人投资者和金融机构交易员提供金融知识服务,并生成金融知识图谱。不过,基于规则的AIGC中也有部分内容属于数据、信息的范畴,如“小冰”作为广播电台或电视台主持人在节目中生成的内容。基于大模型的AIGC,主要包括文本大模型和视频大模型。典型产品代表,前者如ChatGPT、中华知识大模型等,旨在提供全链条数据要素的综合服务方案,后者如Sora、Vidu视频大模型等,具备“长时长、高一致性、高动态性”[14]特点。无论是文本大模型还是视频大模型,其生成的文本、图像、音频、视频数据等,都无限接近于知识,并向知识靠拢。
最后,尤其需要关注出版数据要素的二次数据生成效应。二次数据或曰衍生数据,指数据“背后”的数据,是经过标引、关联、计算后生成的新数据,是大数据发挥预测和预警作用的重要依据和参考,往往关涉数据安全问题。例如,对大量关于能源、矿产等内容的图书进行数字化、碎片化和数据化加工后,经过数据分析、计算、统计、处理得出的衍生数据,甚至可能影响国家能源资源安全。
出版数据要素的生成效应,是高级阶段的乘数效应,是出版数据要素聚合效应发挥的必然结果,是数据要素与数智技术渗透演化的结果,也是数据出版最新业态、最新模式的反映。
5 出版数据要素的渗透效应
数据要素通过自身作用呈现出乘数效应,也可以与其他要素融合驱动其创新产生乘数效应[15]。数据要素是“渗透性要素”[16]和“桥梁型生产要素”[17],需要“在特定应用场景中与其他要素相结合,借助一定的数字基础设施、数据管理体系、数据分析能力等才能发挥乘数效应”[18]。渗透效应是出版数据乘数效应的重要组成部分和不可或缺内容,具体渗透方式和类型体现如下:
5.1 出版数据要素与劳动要素的渗透融合
数据要素赋能图书编辑、数字出版编辑及融合出版编辑,对内提升编辑数据素养和技能,推动出版社的编辑群形成和具备数据化的学习力、适应力、胜任力和创造力;对外进一步丰富编辑岗位类型。数据要素所蕴含的知识、机理、规律和经验最终被编辑吸收和内化,使之成为数智型编辑,提升其文化生产力和精神生产力,从主体维度为推动出版业深度融合发展、高质量发展赋能。
5.2 出版数据要素与资本要素的协同、融合和替代
出版业的资本要素,指“那些通过直接或间接的形式投入到出版物或出版流程的中间产品或金融资产”[19]。数据要素的开发利用,将对出版业资本要素起到协同、融合及替代三重渗透效应:其一,数据要素与资本要素协同,起到降本提质增效的预期作用。通过对数据要素的充分利用,能够分析和研判出版业所投入资本的精准性和可预期性,降低生产经营成本投入,提升出版经营管理效率。其二,数据要素与资本要素的融合共生,催生数据资本要素组合新形态。作为中间产品的内容数据产品、用户数据产品及交互数据产品等,既是数据要素,也是资本要素,二者深度融合形成了数据资本这一生产要素配置的新组合或新要素形态。例如百科类的数据资源,既可以作为百科类知识产品,以独立的数据产品形态出现,又可以作为支撑性的数据资本形态,将百科知识体系的中间品形态作为百科知识库的知识标引依据。其三,数据要素对资本要素的替代效应,作为内容产业的出版业,内容数据资源可以与数智技术相结合,以移动互联网、计算机设备、移动平板设备等为载体,形成数字出版产品、数据出版产品,由此实现对传统原材料资本的替代。
5.3 出版数据要素与技术要素的深度融合、双向赋能
出版数据资源,尤其是内容数据资源,唯有经过与技术要素的结合才会成为出版数据产品。换言之,出版数据产品的形成过程,就是“内容数据资源+数智技术+载体”的过程,其中“载体”可以是有形的,也可以是无形的。反过来说,技术要素,尤其是数智技术,也需要出版数据资源的赋能,需要与出版数据要素深度、有机融合,空有原理而没有场景的技术,将是无源之水、无本之木。
5.4 出版数据要素对管理要素的赋能融合
管理,或曰企业家才能、企业家精神,也是一种新生产要素,是一种渗透性的生产要素。出版数据要素对管理要素的渗透赋能体现在如下几点:首先,出版业内容数据、技术数据、运营数据、用户数据、交互数据及组织数据资源的开发和利用,能够提升出版调节治理决策的科学性和准确性;其次,出版数据要素和管理要素融合,辅以数智化技术、工具、平台的应用,形成数字治理、数据治理及敏捷治理等新模式,能够有效提升出版管理服务的响应程度、处理速度和治理效能;最后,关于数据要素对管理要素的“替代”作用,本文认为,当前的出版治理即出版管理服务,尚无法被数据要素所替代,只能说出版数据要素的充分开发和利用能够协同出版管理要素,出版治理吸收数据要素、数据动能,可以提升出版治理体系和治理能力的数字化、数据化及智能化。
6 结语
出版数据要素裂变效应、聚合效应、生成效应层层递进、循环往复,由此推动着数据出版、生成式智能出版等融合出版新业态新阶段的不断涌现。而出版数据要素的渗透效应则是出版数据要素乘数效应发挥的根本性原因,其背后隐藏着出版数据要素的虚拟性、非竞争性、易复制性、即时传输性、信息和知识的负载性等特征。
关于裂变效应、聚合效应、生成效应三者和渗透效应的关系,前者是“数据×”发挥出版数据要素乘数效应,后者则是“要素×”发挥出版数据要素乘数效应;前者往往是数据自身发挥乘数效应并创造价值,后者则是数据与其他要素融合发挥乘数效应并创造价值。两者之间恰似一枚硬币的两面,既各自客观存在,又不可分割、融为一体。
正如《大数据时代》中所说的,出版社“没有把书籍的数据价值挖掘出来,也不允许别人这样做。他们没有看到数据化的需求,也意识不到书籍的数据化潜力”[20]。随着数据要素成为关键生产要素,出版数据要素乘数效应或将显著发挥作用,这种局面或将得到根本性改观。
其他有关出版数据要素乘数效应的学术议题如“出版数据要素的反馈效应”“基于需求侧的出版数据要素乘数效应”“出版数据要素乘数效应的作用机理”“出版数据要素乘数效应的路径选择”“出版数据要素乘数效应的制约因素和有利条件”等,期待后续开展持续、深入的分析和研究。
作者简介
辛谏,男,博士,上海理工大学出版学院、数字文明研究院教授、博士生导师。研究方向:数字出版、人工智能、文化管理与服务。
李翠玲,女,新疆人民出版社党委书记、总编辑。研究方向:数字出版。
参考文献
KEYNES J M. The general theory of employment, interest and money[M]. London: Macmillan,1936:791-795.
潘文卿,李子奈.中国沿海与内陆间经济影响的反馈与溢出效应[J].经济研究,2007(5):68-77.
任诗婷,曾燕.数据要素乘数效应的内涵与实现逻辑[J].长安大学学报(社会科学版),2024,26(2):38-53.
张新新,刘骐荣.新质生产力赋能数据出版:动因、机理与进路[J].出版与印刷,2024(2):34-44.
财政部办公厅.关于做好中央文化企业数字资源库建设项目国有资本经营预算编制的通知[EB/OL].(2014-07-29)[2024-09-29].https://www.mof.gov.cn/gp/xxgkml/whs/201408/t20140804_2512036.htm.
吴忠民.论中国现代化的乘数效应[J].北京师范大学学报(社会科学版),2021(6):5-19.
法信官网[EB/OL].[2024-08-25].https://www.faxin.cn.
任泽裕,王振超,柯尊旺,等.多模态数据融合综述[J].计算机工程与应用,2021,57(18):49-64.
张新新,刘华东.出版+人工智能:未来出版的新模式与新形态:以《新一代人工智能发展规划》为视角[J].科技与出版,2017(12):38-43.
张新新.新闻出版业大数据应用的思索与展望[J].科技与出版,2016(1):4-8.
张新新,黄如花.生成式智能出版的应用场景、风险挑战与调治路径[J].图书情报知识,2023,40(5):27,77-86.
张新新,丁靖佳.生成式智能出版的技术原理与流程革新[J].图书情报知识,2023,40(5):68-76.
张新新.生成式智能出版:知识生成原理、沿革与启迪:从智慧驱动到数据驱动[J].编辑之友,2023(11):36-44.
魏梦佳.我国自研视频大模型面向全球上线[EB/OL].(2024-08-05)[2024-08-25].https://www.tsinghua.edu.cn/info/1182/112990.htm.
张夏恒,冯晓宇.数据要素乘数效应的逻辑解构与实现进路[J].长安大学学报(社会科学版),2024,26(3):91-102.
张新新,刘骐荣.新质生产力驱动出版高质量发展的三个着力点[J].中国出版,2024(12):8-14.
任诗婷,曾燕.数据要素乘数效应的内涵与实现逻辑[J].长安大学学报(社会科学版),2024,26(2):38-53.
杨俊,李小明,黄守军.大数据、技术进步与经济增长:大数据作为生产要素的一个内生增长理论[J].经济研究,2022,57(4):103-119.
张新新,孙瑾.要素·结构·功能:出版业高质量发展经济维度分析:基于提高出版经济活动质量的视角[J].数字出版研究,2023,2(4):47-56.
维克托·迈尔-舍恩伯格,肯尼斯·库克耶.大数据时代[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013:112.
An Analysis of Multiplier Effect of Publishing Data Elements—Based on the Perspective of Publishing Supply Side
XIN Jian1,2, LI Cuiling3
1. College of Publishing, University of Shanghai for Science and Technology, 200093, Shanghai, China; 2. Institute of Digital Civilization, University of Shanghai for Science and Technology, 200093, Shanghai, China; 3. Xinjiang People’s Publishing House, 830049, Urumqi, China
Abstract: Spillover effect of data elements on the supply side of publishing consists of fission, aggregation, generation and penetration effect. Fission of content resources, data modality, and data product are the basic connotations of fission effect; aggregation of heterogeneous multimodal data resources, e-books to digital library, data clustering, and publishing data corpus-big data-large model form the aggregation effect; artificial intelligence generated contents based on templates, rules, group intelligence and large models accelerate the formation of the generation effect; the penetration, synergy, fusion, and substitution of publishing data elements with labor, capital, technology, and management elements jointly interpret the penetration effect. The fission, aggregation, and generation effects play publishing data elements multiplier effect from the perspective of “data ×”, while the penetration effect play multiplier effect from the “elements ×” perspective. The former is always the data itself to play multiplier effect and create value, while the latter is always the integration of data and other elements to play multiplier effect and create value.
Keywords: Data publishing; Publishing data element; Data element multiplier effect; Fission effect; Aggregation effect; Generation effect; Penetration effect