数据定价研究的主题演变及趋势
——基于CiteSpace的文献计量分析*
2024-05-14梁燕妮尤建新
梁燕妮 尤建新
(1.北部湾大学经济管理学院,钦州 535011;2.同济大学经济与管理学院,上海 200092)
0 引言
近年来,随着“新基建”政策推进、数字化转型加速、企业降本增效需求提升,我国数据要素市场规模增长迅猛。根据中国信息通信研究院公布的数据,2017—2022年我国数据中心行业市场收入的年均复合增长率约为30%[1]。2022年,国务院发布《“十四五”数字经济发展规划》,提出我国数字经济发展的目标是到2025年 “数据要素市场化建设成效显现,数据确权、定价、交易有序开展”[2]。数据价值化是数字经济的重要组成内容,而数据定价是实现数据价值化的重要手段。因此,研究数据定价、释放数据要素价值、加速培育数据要素市场已经成为当前数字经济发展的最紧迫任务。根据中国信息通信研究院发布的《数据要素白皮书(2022年)》[3],我国最早的数据交易机构源于2014年,截至2022年11月,我国先后设立48家数据交易机构,但由于供需双方存在信息差且无数据定价统一标准,目前尚未形成有效的商业模式。因此,对数据定价研究的主题演变、趋势、时代背景开展深入研究,将有助于从系统、全面、全局的视角,揭示与反映数据定价研究领域的状况、进展、热点、前沿、趋势,为促进我国经济高质量发展和加速数据要素市场培育提供决策依据与政策参考。
1 相关研究文献评述
国内外存在少部分研究者从网络外部性的角度认为数字产品免费也是一种可行的定价方式。然而,数据成本结构特殊,传统的完全免费定价方式和一般产品的定价方式并不适用于数据。欧美各国及地区的数据定价政策经历了多个阶段,包括免费、基于成本回收的定价、考虑边际成本的定价、市场定价等[4]。我国在数据定价研究领域的研究热点则经历了由“产品自身特征”到“消费者需求”再到“盈利模式和隐私保护”的变化过程。近年来,国内外关于数据定价的研究呈现出多维度、交叉融合的特点。基于产品差异性,熊巧琴和汤珂[5]通过深入剖析数据资产的可复制性和价值不确定性,揭示了应用场景及买方异质性对数据产品交易模式的显著影响。基于消费者差异性,李伟和梁佳[6]通过构建消费者动态效用模型及数字产品企业决策模型,验证了渗透定价策略在低消费群体中的有效性;Reisman[7]等则进一步拓展了按需付费定价理念提出的Fair Pay新框架。结合成本效益因素,蔡莉[8]等系统评价了现有数据定价模型的优劣,牛超越[9]等提出了基于价格表和请求的在线实时定价机制并验证了其经济优越性。随着人们对知识产权保护的日益关注,Zhang[10]和徐素秀[11]等分别从制造商和零售商层面以及网络外部性影响的角度,为数字产品版权保护下的定价策略提供了理论支撑。同时,博弈论亦为数据定价研究贡献了新的分析工具,Hajji[12]等和赵馨燕[13]等运用博弈论分别构建了动态定价模型和均衡价格求解框架。此外,还有不少学者[14-16]将数据定价抽象为数据要素价值,分析数据定价在数字企业商业模式创新、绩效提升中发挥的作用。也有不少学者[17-18]从数据资产的概念内涵出发,分析数据资产的价值构成和评价影响因素,构建了数据资产价值评估方法体系。
从目前国内外研究的进展可知,国内外学者针对数据定价的研究多为一般性研究,大部分学者忽略了不同应用领域数据要素类型的差别,倾向于从数据提供方或数据购买方某一主体角度去研究数据定价,主要通过采用数学规划法和构建博弈模型来研究数据定价的策略。相比较而言,目前聚焦数据定价领域的研究现状、热点演进与趋势展望等方面的文献鲜见,不利于读者从海量文献信息中系统地掌握数据定价研究的脉络、热点、前沿。近年来,“双碳”目标与数字经济持续成为社会各界热点。鉴于此,本文借助CiteSpace软件对中国知网(China National Knowledge Infrastructure,CNKI)和Web of Science(WOS)数据库相关中英文文献进行计量分析,并结合“双碳”时代背景对数据定价研究的主题演变和趋势展开深入研究,以期为数据定价研究提供基础研究支撑,向政策决策者提供有益的建议。
2 研究方法与数据来源
2.1 研究方法
CiteSpace这一文献研究工具具有可视化复杂研究领域和揭示研究主题演变规律的能力,崔军[19]、杨秀勇[20]、段海煦[21]、王利辉[22]等学者分别将CiteSpace应用于经济、社会、环境、政策等研究领域的探索。本文基于前人的研究,借助CiteSpace软件对1993—2022年数据定价相关文献作系统分析,进行数据分析和可视化呈现,剖析数据定价研究的主题演变历程并探测其发展趋势。
2.2 数据来源
数据是一个母集,包含了信息和数字,其中信息和数字间有交集。数字是数据的子集,因此,考虑到数字产品定价和数据定价的共通性和可借鉴性,本文将数字产品和数据定价方法的相关研究作为文献分析的范畴。本文根据CNKI以及WOS数据库中的研究数据分别构建基础分析数据库。以CNKI数据库中的科学引文索引(Science Citation Index,SCI)、工程索引(Engineering Index,EI)、北大核心、中文社会科学引文索引(Chinese Social Sciences Citation Index,CSSCI)和中国科学引文数据库(Chinese Science Citation Database,CSCD)学术期刊论文作为基础数据源,使用高级检索功能设定检索条件:主题为“数据”“数字产品”“定价”,采用精确匹配方式;论文发表时间为1993—2022年。在初步检索后,获得权威论文1 795篇。为降低相关度不高论文的影响,本文通过逐一筛选、剔除与主题相关度低的论文,最终获得有效论文91篇。在WOS官网中选择其核心合集,设定检索条件:主题为“data”“digital product”“pricing”,文献类型为“论文”“综述论文”,出版日期为1993年1月1日—2022年12月31日。在初步检索后,获得论文较多,从中筛选、获得相关度高的有效论文132篇。
3 文献时空知识图谱
3.1 文献时间分布图谱
图1(a)显示,1993—2022年的30年间,CNKI数据库中与数据定价研究相关度高的权威论文总数较少,仅91篇,且整体随时间呈现波动上升态势。其中,1993—2001年论文篇数为0;2002—2020年论文发表篇数随时间呈波动上升态势,且多次出现论文发表数的小高峰,年平均论文发表篇数为3;2020—2022年论文发表篇数呈快速上涨趋势,并于2022年达到近30年的峰值19篇。
图1 数据定价研究论文发表时间分布
图1(b)显示,1993—2022年的30年间,按照和CNKI数据库中的相同检索条件,从WOS数据库中检索出来的论文篇数较多,但与数据定价研究相关度高的论文仅132篇,且整体随时间呈现波动上升态势;最早发表论文的时间是2000年,相比在CNKI数据库中检索到的最早时间提前了2年;论文发表数随时间的波动上升态势则与之在CNKI数据库中检索到的情况基本一致;1993—1999年,与数据定价研究相关的论文篇数为0,这与1998年美国商务部宣告数字经济正式诞生的时间逻辑基本相符;2000—2018年,论文发表篇数随时间呈波动上升态势,且多次出现论文发表数的小高峰,年平均论文发表篇数为4;2018年后,论文发表篇数呈快速上涨趋势,并于2022年达到近30年的峰值23篇。
3.2 文献空间分布图谱
3.2.1 作者分布
本文以“作者”为节点类型,选择时间跨度为2002—2022年,运行CiteSpace软件,得到密度为0.0116的关于数据定价研究的CNKI作者共现知识图谱(见图2(a)),共181个节点、189条连线,表明各个作者之间存在一定程度的合作研究交流。图2(a)从中心到外圈为时间由近至远的作者分布情况,表明该研究领域的作者有一定的合作关系,但同一作者持续性研究的情况较少。通过CiteSpace作进一步统计分析,发现本文选用的91篇论文样本共涉及94位作者,而其中在CNKI数据库中发文量超过1篇的作者有6位(见表1)。
表1 发文量超过1篇的国内外作者
图2 作者共现知识图谱
基于WOS数据库的相关文献样本,选择时间跨度为1993—2022年,运行CiteSpace软件,得到密度为0.008 1的关于数据定价研究的WOS作者共现知识图谱(见图2(b)),共271个节点、296条连线。从图2(b)中可以观察到作者呈现的网络结构整体较紧密,各个作者节点之间连线较多。这表明WOS数据库中数据定价研究领域的作者之间合作较频繁,少部分作者开展独立研究,同时不少作者(如Dong Xiangqian、Mcmurtrey Mark E等)节点圆环显现多种颜色,表明该部分作者在该领域有持续的研究。在WOS数据库中发表相关研究论文的作者共271位,发文量超过1篇的作者名单如表1所示,其中Kannan P K近30年发文量高达5篇,Mcmurtrey Mark E等5位作者近30年的发文量均为3篇。
3.2.2 机构分布
本文以“机构”为节点类型,选择时间跨度为1993—2022年,运行CiteSpace软件,得到密度为0.0074的CNKI研究机构共现知识图谱(见图3(a)),共有113个节点、47条连接。从图3(a)可知,CNKI数据库中在数据定价方面进行研究的机构共113个,各个研究机构之间连线较少仅47条,说明存在跨机构研究,但合作不频繁,开展独立研究的机构有南京大学、北京邮电大学等。这表明尽管该研究领域引起了学术界的广泛兴趣,但研究机构之间似乎缺乏协作意愿,知识和研究成果的共享与交流程度相对不高。此外,值得注意的是,研究机构主要以高校为主,缺乏高校与数据供应商的合作研究。
图3 研究机构共现知识图谱
从图3(b)可知,WOS研究机构共现知识图谱密度为0.012 4,节点数和连接线数分别为192和228,即WOS数据库在数据定价方面进行研究的机构共有192个,各个研究机构之间连线较多合作研究较频繁,跨机构研究方面形成较明显的聚类。这表明该研究领域机构之间合作较多且需共享和交流研究资源;不少研究机构(如Tsinghua University、Shanghai Jiao Tong University等)节点圆环显现多种颜色,表明该部分研究机构在该领域有持续的研究。但同样需要注意的是,研究机构主要以高校为主,缺乏高校与数据供应商的合作研究。
发文量超过1篇的国内外研究机构名单如表2所示。其中,CNKI数据库中的中央财经大学金融学院、中央财经大学和上海大学发文量最多,均为3篇;南京大学、电子科技大学、清华大学、中国传媒大学和北京邮电大学发文量次之,均为2篇。WOS数据库中的University of Maryland College Park和University System of Maryland发文量最多,均为7篇;National University of Singapore、University of Washington、University of Washington Seattle和Tsinghua University发文量次之,均为5篇。这表明国内外高校是现阶段数据定价研究领域的主力。
表2 发文量超过1篇的国内外研究机构
4 热点演进
4.1 热点主题
为了探究国内外数据定价研究领域的热点问题现状,本文选择时间跨度为1993—2022年,运行CiteSpace软件,对数据定价研究相关关键词的共现关系进行统计和聚类分析,得到关键词聚类知识图谱(见图4)。其中,CNKI数据库中的前6个聚类标签分别是“价格机制”“定价机制”“数字内容”“大数据”“成本”“定价方式”;WOS数据库中的前10个聚类标签分别是 “data pricing”“game theory”“massively multiplayer online role-playing game (mmorpg)”“geometric programming”“price”“bundling”“online piracy”“digital goods”“digital products”“quality-of-service-oriented digital services”。
图4 关键词聚类知识图谱
如图4所示,本文对关键词作进一步分析,得到不同关键词的出现频次、中心度、最早出现年份等信息(见表3);进一步地,在CiteSpace软件里的“Clustern”菜单栏中选择“Summary Table | Whitelists”,获得关键词共现网络聚类信息(见表4);由此判断出近30年来数据定价研究领域的热点主题词。
表3 关键词分析
表4 关键词共现网络聚类表
4.2 前沿演进
研究前沿是指某研究领域的新兴理论和热点主题,可通过对关键词时区图和突现词进行深入分析和判断得出。通过选择CiteSpace软件的“layout | Timezone View”选项,可生成如图5所示数据定价研究关键词时区图。图5中CNKI和WOS数据库中的相同聚类关键词会根据各自首次出现的年份在时间线上呈现,这有助于研究人员更全面地评估和判断该领域的研究动态。从分析CNKI数据库文献可知,针对“价格机制”的研究时间线较完整,“数据”与“价格机制”相关的研究持续开展,共现关系明显。近年来,CNKI数据库中的学者主要关注数据定价在公平交易、隐私权属、要素流通等方面的研究。通过对比可知,WOS数据库中针对数据定价方面的研究文献更丰富,生成的相应有效聚类更多,出现了与算法、营销策略、数据安全和服务质量相关的关键词。近年来,WOS数据库中的学者主要结合隐私安全与保护、人工智能、客户服务、市场营销等方面开展数据定价的研究。
图5 数据定价研究关键词时区图
图6展示了CNKI和WOS数据库中数据定价相关研究文献内具有高突现值的节点现词。根据CNKI数据库数据源,得到13个具有高突现值的节点现词:早期研究前沿的突现时间为2002—2008年,该阶段研究前沿主要集中在“数字产品”“动态成本”“动态效用”“网络定价”“定价”和“定价策略”方面;中期研究前沿的显著涌现期跨越了20年(2009—2018年),该阶段研究前沿主要集中在“数字产品”“定价策略”“双边市场”“数字内容”“价格机制”和“大数据”方面;近期研究前沿的突现时间为2019—2022年,该阶段研究前沿主要集中在“大数据”“数据定价”“数据资产”和“数据交易”方面。
图6 数据定价研究突现节点词汇图
基于WOS数据库中关于数据定价研究的文献样本,得到15个具有高突显值的节点现词:早期研究前沿的突现时间为2002—2011年,该阶段研究前沿主要集中在“internet”“digital products”“monopoly”“software piracy” 和“diffusion”方面;中期研究前沿的显著涌现期跨越了6年(2012—2017年),该阶段研究前沿主要集中在“digital products”“diffusion”“information goods”“game theory”“economics”“cloud computing”和“big data”方面;近期研究前沿的突现时间为2018—2021年,该阶段研究前沿主要集中在“big data”“markets”“data market”“strategy”“determinants”和“impact”方面。
5 “双碳”背景下的数据定价研究趋势
综上分析可知,国内外针对数据定价的研究较为丰富,“数据”与“低碳”共现的情况甚少。随着全球对环境可持续发展的日益关注,为体现数据定价研究的应用性和时代特征,给企业在“双碳”背景下数字化转型的降本增效提供科学指导和决策支持,数据定价研究需从环境可持续性、消费者行为、企业战略、技术创新等多个视角进一步创新。
环境可持续性:在“双碳”背景下,随着环境、社会和公司治理(Environmental, Social and Governance,ESG)投资理念的推广,环境可持续性成为数据定价研究中的重要视角。未来的研究可以进一步探索如何将环境成本和绿色元素纳入数据定价模型中,以反映产品的环境影响和可持续性。比如探索数据定价与碳排放之间的关系,包括碳定价机制的应用、数据产品/服务碳足迹的定价方式等;关注绿色技术、标签、电力市场价格变动等对数据定价的影响。
消费者行为:消费者对数据产品/服务的反应和行为同样影响数据定价机制的设计。未来可以探讨消费者对于碳足迹定价、碳补偿定价和其他环境相关定价策略的偏好和接受程度,以及消费者对于绿色数据产品/服务的价值感知和购买意愿。
企业战略:数据供应商在“双碳”背景下基于数据定价的战略调整模式同样值得探讨。结合宏观环境(政策与法规)和市场需求,研究企业如何在碳足迹定价、碳补偿定价和碳市场交易等不同定价模式中制定合适的策略,并对不同策略对企业竞争力和市场地位的影响进行系统评估。
技术创新:随着数字技术的不断演进,可以将新的定价模型和算法应用于数据定价领域。如利用大数据分析和机器学习等技术,构建更准确的效益测算模型,从而实现更精细化的定价策略,并确保数据供应链领域数字技术应用与环境可持续发展的融合。
6 结束语
本文通过CiteSpace软件对国内外关于数据定价的研究现状、主题热点、趋势进行了系统的对比分析,得出3方面结论。在发文时间、发文量和研究模式方面,国外针对数据定价的研究早于国内,国外自2018年后数据定价相关研究呈稳定快速增长趋势,这一时间比国内早了2年;国外相关度高的文献量高于国内;近3年来,国外相对国内更倾向于合作研究,国内外均缺乏与数据供应商的产学研合作案例。在研究热点与前沿方面,WOS数据库中的文献针对数据定价方面的研究更丰富,生成的相应有效聚类较多,国内侧重于研究数据定价的成本效益、公平交易、隐私权属等,国外则侧重于结合隐私安全与保护、人工智能算法、客户服务质量等方面开展数据定价的研究;通过分析突现节点词可知,国内外数据定价研究均与信息技术的发展密切相关。在发展趋势方面,随着“双碳”目标的实现和ESG评价指标的执行,数据供应链各参与方将共同致力于把可持续发展和绿色技术融入到数据的应用和定价中,确保数据产品和服务在环境保护方面的友好性和可持续性。
本文旨在为学者提供数据定价可参考的研究范围,同时也为数据供应商提供数据定价模式参考。但是,本文未对国内外数据要素市场政策规制进行梳理及讨论。未来,立足我国现实国情与发展目标,对比分析国内外在数据要素市场政策法规、数据市场交易和监管机制、数据定价策略等方面的异同,有所取舍、辩证吸收,构建数据要素市场的中国道路,是值得研究的课题。