我国数据要素市场的知识基础、 研究热点与前沿动态
——基于CiteSpace 的图谱量化研究
2024-04-14孙陶陶何琦
孙陶陶, 何琦
(上海工程技术大学管理学院, 上海 201600)
0 引言
实体经济是数字经济发展的基石, 数字经济为实体经济高质量发展培育新动能、 开辟新领域。数据已成为我国抢占未来全球竞争制高点、 推动经济转型升级的战略性资源, 影响着数字经济乃至国民经济的发展水平。 在此背景下, 党的十九届四中全会将数据纳入新型生产要素。 2020 年3月, 中共中央、 国务院明确提出要加快数据要素市场建设、 促进数据红利释放。 2022 年12 月,《关于构建数据基础制度更好发挥数据要素作用的意见》提出构建数据基础制度的二十条举措, 为数据要素价值实现奠定了制度基础。 在数字经济体系中, 数据只有实现了快速流动才能创造价值,然而数据产权不清晰、 数据流通不畅、 数据交易安全监管不足、 数据治理体系不完善等问题不断出现, 制约了数据要素流动与价值开发利用。 大量数据资源聚集于政府和头部数据企业中, 如何完善数据市场建设、 促进数据价值释放显得至关重要。
国外对于数据要素市场的探索要早于国内,先后已有30 多个国家和地区出台了规范数据流通交易的政策和建议, 产出了大量学术文献。Azcoitia 等[1]对全球97 家数据交易中介展开了详尽调查, 发现数据市场的明确定义仍然缺失, 不同的数据市场在基础业务模型, 提供的数据类型、功能、 市场机制等方面有所不同。 自数据被列为新型生产要素以来, 国内关于数据要素市场建设的研究热度飙升, 学者围绕数据要素的价值属性及市场化配置展开系列研究, 数据要素的价值已得到广泛认可, 但学者对数据产权界定、 数据定价机制、 交易监管等研究热点各持己见, 暂未达成共识。 梳理我国已有的数据要素市场研究, 不仅有助于厘清其理论基础, 更有着深刻的政策价值与现实意义。
基于此, 本研究使用科学知识图谱为核心研究范式, 对我国数据要素市场领域的研究现状、发展脉络及前沿动态进行解读分析, 明确数据要素市场领域的研究热点, 为我国建设数据要素市场提供参考。
1 我国数据要素市场的研究源起
1.1 数据要素市场的内涵
《数据要素白皮书(2022 年)》中指出, 数据要素是指参与到社会生产经营活动中, 并为数据所有者或使用者带来经济效益的数据资源。 在数字技术和大数据产业的演变中, 数据成为推动生产力发展的关键要素。 数据要素价值挖掘与开发利用程度决定着数字经济甚至国民经济的发展水平,数据要素市场随之诞生。 数据要素市场即数据要素在流通过程中形成的市场, 既包括数据资源化、资产化、 资本化中的交易关系, 也包括发生这些数据交易的场所或领域[2], 是利用市场化手段配置数据要素资源涉及的所有经济关系的有机统一体[3]。 宏观层面上, 数据要素市场可视为数据交易的法规、 制度、 标准、 基础设施等, 微观层面则可直接视为发生数据交易的场所[4]。 数据要素市场培育的关键并不是交易场所, 而是与数据要素特征相适应的基础性市场制度[5], 主要涉及数据生产要素化、 数据确权、 数据定价、 交易平台、交易规则、 交易监管等[6]。 数据要素市场的发展受技术变化、 制度环境以及社会文化环境等一系列因素的共同作用[4]。
本研究认为, 数据要素市场是以数据产品或服务为交易对象, 通过流通来实现数据供给方与需求方各自诉求、 发挥数据价值的场所, 其合理运行需要明确的数据产权制度、 合理的交易规则、清晰的定价机制以及配套数据保障技术等。
1.2 我国数据要素市场培育的政策背景
早在2000 年, 我国就已开始将信息资源纳入国家信息资源体系进行战略研究, 随着个人信息和数据的价值日益凸显, 追求数据红利也加速了数据产业的发展, 促使了数据转向数据要素的跃迁。 2019 年10 月, 数据首次被界定为生产要素,参与收益分配, 党中央、 国务院高度重视大数据的利用发展, 出台了一系列政策措施, 对培育数据要素市场、 推进数据交易提出明确要求、 指明发展方向。 我国对数据的认知经历了从信息资源、数据资源再到数据要素的不同阶段, 对其内涵的理解也在逐步深化。 见表1。
表1 我国培育数据要素市场的相关政策
1.3 国外数据要素市场相关研究
数据交易市场的发展与数字经济的发展及各国数据政策的落实密不可分。 国外对数据市场的探索要早于国内, 为抢占国际竞争制高点, 多个国家和地区先后出台了各种促进数据交易的政策和规定。 欧盟最早针对数据确权、 交易双方权利等问题进行体系性构建, 相继颁布《通用数据保护条例》《非个人数据在欧盟境内自由流动框架条例》和《数字市场法》, 创设“数据生产者权”, 界定了个人数据和非个人数据确权机制[7]。 美国对个人数据保护的法律法规较为宽松, 暂未针对数据保护专项立法, 形成了“市场主导+行业自律+政府监管”的机制[8]。 在数据要素流通方面, Koutroumpis等[9]提出数据流通的主要途径包括公共数据对外开放、 市场化主体之间数据共享以及交易。 2018年, 美国佛蒙特州正式通过了《数据经纪商监管法案》, 明确了数据经纪商的义务, 规范数据经纪商的不正当数据搜集与数据交易行为。 2022 年, 欧盟《数据治理方案》创设了数据中介制度, 规定由数据中介促成数据供给方与需求方间的数据共享,并接受政府部门全过程监管。
总的来说, 在培育数据要素市场、 促进数据交易流通方面, 各国和地区都具有一定的共性,比如都试图通过完善顶层制度、 制定法律法规来规范数据流通与交易, 如美国凭借技术优势获取了庞大的数据经济体量并带动本国数据市场的发展, 欧盟则通过在数据治理领域的领先探索来完善数据市场生态, 但国外关于建设数据市场的探索措施仍存在一定争议, 无法完全适配我国情况。根据Banterle[10]、 蒋林君[11]的研究, 从产权构建来看, 欧盟虽建立了数据生产者权, 但引发了与欧盟既有法律制度的冲突, 短期内无法形成共识性的解决方案。 美国数据战略及相关法律法规的实施多是围绕数据经纪商的商业活动展开, 仍缺少数据保护与流通方面的统一立法。
2019 年10 月, 我国突破性地将数据纳入生产要素的范围, 随后党中央对加快培育数据要素市场的规划提出了要求与目标。 把数据作为参与分配的要素, 将推动数字经济形成新优势、 新模式和新业态[12]。 我们不能照搬国外数据市场的发展模式, 而应当结合国情, 建立起具有我国特色的数据产权制度体系、 数据要素交易制度体系及数据要素市场。
2 研究方法和数据来源
2.1 研究方法
科学知识图谱这一研究方法通过绘制一系列可视化图谱直观展现学科研究热点和前沿动态,有助于准确把握研究热点演化路径[13]。 本研究以数据要素市场为出发点, 综合运用传统文献综述方法、 科学知识图谱分析方法, 借助科学可视化技术软件CiteSpace 5.7.R5 对中国知网(CNKI)文献库中数据要素市场相关文献的研究热点与动态进行可视化知识图谱绘制, 为未来我国加快推进数据要素市场建设提供研究方向和理论借鉴。
2.2 数据来源
为保证检索文献的完整性, 在CNKI 数据库中以“数据要素市场”或 “数据市场”或“数据要素”或“数据流通”或“数据交易”为主题词进行检索, 仅选取学术期刊, 收集日期为2012 年至2022 年的文献, 范围界定为经济与管理科学分类。 将最终保留的203 篇目标文献按CiteSpace 5.7.R5 所需的Refworks 格式导出并保存为研究对象, 得到样本数据库。
3 数据要素市场基础分析
3.1 发文量分析
2012—2022 年, CNKI 数据库中经济与管理科学相关期刊收录的我国数据要素市场领域发文数量变化情况见图1。
图1 2012—2022 年我国数据要素市场研究发文数量
2020 年之前, 我国关于数据要素市场的研究量较少, 最高发文量也仅为2016 年的5 篇, 自2020 年开始, 研究热度持续走高, 发文量倍增。2015 年之前, 我国数据要素市场处于起步阶段,2014 年贵阳大数据交易所的成立实现了数据交易机构从无到有的跨越, 随后我国数据交易所数量呈井喷式增长, 此时, 数据交易普遍效率低下、质量不高。 学者们逐渐意识到数据要素具有的非竞争性、 非消耗性及衍生性的特征, 使实际的数据交易面临产权不明、 定价机制不完善、 交易规则混乱和交易监管缺失等挑战[14], 数据交易市场需以安全合规为前提探索新型发展模式。
自2020 年起, 数据要素市场进入全新阶段,追求高速发展与高质量发展协同进行。 学界围绕数据要素市场的研究热度不断上升, 成果不断增多, 仅2022 年的发文量就高达118 篇, 占样本总数的58.1%。 数据交易市场的发展, 与政策颁布和制度建立密不可分。 我国高度重视数据要素市场建设, 加紧出台有关数据政策来提供制度保障。数据作为全新的生产要素, 吸引着越来越多的学者关注, 如何建设数据要素市场、 保障数据交易有序进行等主题的关注度暴涨, 相关研究话题炙手可热。
3.2 发文机构分析
根据样本数据, 我国共有106 个机构围绕数据要素市场展开研究, 研究高产机构(产出篇数前十名)见表2, 包含城市经济发展研究院、 国家信息中心大数据发展部、 高校科学技术学院、 高校管理学院、 高校经济学院等, 其中各城市数据研究所和高校数据研究机构发文量大致相似, 是我国数据要素市场主题研究的主要阵地。
表2 我国数据要素市场研究高产机构情况
研究发现, 虽然北京邮电大学2016 年就发表了关于数据要素市场的高水平论文, 但近年来产出不多, 仅有3 篇。 表2 中共有6 个研究高产机构在2022 年才开始布局数据要素市场的研究, 抢占研究高地。 成都市经济发展研究院在2022 年发表了首篇关于数据要素市场的高水平论文, 随后在学科带头人带领下, 围绕着数据定价、 数据分类保护等主题持续产出高水平论文, 发文数量位居第一。 国家信息中心大数据发展部、 上海市数据科学重点实验室及深圳市数据湾区大数据研究院从2020 年起开展了围绕大数据产业及数据要素市场建设的持续探索, 为培育数据要素市场、 释放数据红利提供了参考。 北京大学经济学院、 中央财经大学中国互联网经济研究院及北京邮电大学经济管理学院也在探讨数据权属界定及数据流通的交易规则。 复旦大学计算机科学技术学院、 武汉大学信息管理学院及清华大学计算机科学与技术系则更加关注数据定价机制的演变及数字技术的创新发展。
3.3 高被引文献分析
对样本文献进行计量可视化分析, 能对数据要素市场相关研究的数量、 机构、 作者等展开统计分析, 有助于了解本领域同行关注和引用的共同知识基础, 其中被引用频次前10 位的文献, 如表3 所示。
表3 我国数据要素市场研究领域高被引文献
从表3 可看出, 被引用频次较多的文献多为数据定价机制、 数据确权、 数据交易及数据要素市场化建设领域的研究。 在数据定价方面, 刘朝阳[15]提出根据成本价格论和效用价格论为数据确定一个合理的价格区间, 再通过协商进一步精细化确定数据产品价格; 王文平[16]具体分析了5 种定价策略的适用范围; 熊励等[17]从定价理念的角度出发, 提出数据产品交易在考虑卖方成本收益的基础上, 也要参考买方的客户感知价值来平衡买卖双方的收益; 陆岷峰等[18]主张仿照股票市场的运行原理, 在数据资产估值定价体制构建过程中建立数据资产一二级市场, 一级市场用于数据采集和价值分配, 二级市场用于交易定价。
在数据权属界定方面, 田杰棠等[19]指出, 数据从搜集、 筛选、 处理、 分析等生产链条经过多个参与者, 权利责任与收益分配需要在各参与者之间进行划分而导致数据权属界定困难; 熊巧琴等[20]对数据资产界权、 交易进行综述, 指出区块链技术生成的数字时间戳可有效地记录交易时序,有助于对数据资产进行界权。
在数据交易方面, 田杰棠等[19]结合各地数据交易机构的实际交易情况指出, 目前我国数据交易模式主要为数据撮合交易和数据增值服务2 种;李成熙等[21]根据数据交易所提供的数据产品和服务的不同, 将数据交易主体划分为数据交易平台、数据持有型数据交易平台、 数据交易卖方和技术服务型数据平台。
在数据要素市场化建设上, 何玉长等[6]对数据要素市场化进行了理论阐释; 于施洋等[12]剖析了目前我国构建新型数据要素市场体系面临的挑战, 并提出具有实践意义的解决方案; 唐要家等[22]则分析了数据要素经济增长倍增机制及其治理体系。
4 数据要素市场研究热点及动态分析
4.1 研究热点
关键词是论文使用的规范化词汇, 是学者对文献主题思想和核心观点的凝练。 本研究运用CiteSpace 5.7.R5 软件导出数据要素市场领域出现频次前10 位的关键词, 如表4 所示。
表4 数据要素市场研究高频关键词
从表4 可见, “数据要素”出现得最多, 高达65 次, 充分说明了数据要素的主体地位。 前10 位关键词均围绕数据要素这一主题展开研究, 探讨数字经济时代下数据要素利用、 数据交易、 数据市场化配置、 数据资产及数据定价机制等主题。
文献关键词聚类分析围绕203 篇样本文献进行, 通过分析其聚类图谱及关键节点, 揭示出数据要素市场的研究热点及知识结构。 将节点类型设置为“Keyword”、 时间切片为1 年、 阈值为50,绘制关键词聚类图谱。 剔除效果不佳的聚类后, 最终形成数据产权、 数字经济、 数据安全、 定价策略、市场化配置、 数据价值6 个聚类(见图2)。
图2 基于LLR 算法的数据要素市场文献关键词聚类图谱
4.1.1 数据产权
聚类1 突出的研究主题为数据产权, 相关研究热点主要围绕数据确权方法展开, 分别从数据价值形成过程、 具体实践、 技术、 法律规制和行政监管层面对数据确权所处困境进行分析, 并提出相应解决路径。 从数据价值形成过程来看, 许多学者主张从多元化的角度细分数据产权, 提出了创生赋权论、 分级确权论等观点。 王蒙燕[23]、 朱瑞博等[24]、 王伟玲等[25]及黄丽华等[26]学者主张根据数据产生、 搜集、 加工、 处理再到销毁的生命周期所涉及的多主体共同拥有数据产权并且参与收益分配。 赵磊[27]依据主体类型, 将数据产权细分为政府数据产权、 企业数据产权和个人数据产权。 朱宝丽[28]、 王蒙燕[23]认为要赋予数据主体原始数据所有权、 数据处理者开发及加工后的数据所有权, 政府部门对公共数据享有所有权。 戎珂等[29]构建经济学模型论证了数据要素市场分级授权机制, 建议政府可通过该机制促使企业自发地基于市场规则遵循数据分级授权的要求。
为解决现实生活中的数据确权争议, 童楠楠等[30]基于对欧美和我国数据产权确立的实践, 提出基于中国特色数据产权制度体系的“三边框架”,分别是强调人格权保护的个人数据产权框架、 强调财产权保护的企业数据产权框架以及强调国家数据主权的国家数据产权框架。 此外, 算法和区块链能为数据确权提供技术层面的支撑。 由于数据要素的自身特性以及数据权属的复杂性, 迄今为止我国尚未在法律层面进行数据所有权的专项立法, 数据确权的制度设计有待完善, 相关工作任重道远。 数据权属界定及其法律问题, 已成为大数据时代亟待解决的基础性理论问题。
4.1.2 数字经济
聚类2 突出的研究主题为数字经济, 学者的研究热点在于数据要素市场建设和数字经济发展之间的内在联系。 杨艳等[31]基于数据交易平台的视角, 指出目前我国数据要素市场化配置滞后于数字经济发展。 李直等[32]认为数字经济的健康发展是培育数据要素市场的基本前提, 数据要素市场的高效建设是推动数字经济发展的必然要求。 刘满凤等[33]发现数据要素市场建设促进了数字经济发展, 且不同城市间数字基础设施、 政府干预程度、 创新能力方面存在显著的异质性。 陈伟光等[34]指出要对数字经济进行有效且恰当的治理来推进数据要素统一大市场的建立。
4.1.3 数据安全
聚类3 突出的研究主题为数据安全, 关键文献主要围绕保障数据安全的技术、 数据安全治理策略以及制度设计展开。 陈磊等[35]介绍了当前数据要素市场存在的差分隐私、 敏感数据识别、 安全多方计算和联邦学习等10 种前沿数据安全技术以及应用。 刘明达等[36]介绍了区块链在增强数据机密性、 完整性和可用性3 个方向的最新研究成果,指出区块链技术的合理应用能增强分布式环境下的数据安全。 从事前防范到事后追溯、 从个人隐私保护到捍卫国家数据主权, 数据安全交易离不开数据技术的应用与突破。 关于数据安全治理策略, 阙天舒等[37]、 王玎[38]提出数据分级是数据全生命周期保护的基础, 应以法律、 行业标准为依据, 加快落实数据分类分级保护制度, 对不同类别和风险等级的数据采取差异化和有针对性的调控措施, 以保障数据流通利用的安全。 刘晓娟等[39]基于生命周期视角阐述科学数据安全分级管理实践, 并指出要根据数据所处生命周期阶段,从物理、 技术和管理3 个方面保障各等级数据的安全。 鄢浩宇[40]提出引入数据信托理论, 构建数据控制者的信义义务制度框架, 进行个人信息保护。
针对数据安全治理的制度设计, 洪延青[41]指出目前《数据安全法》无论是在战略和集体制度构建, 还是在实际数据交易中的应用都存在不足,应当对此予以针对性优化。 张勇等[42]指出传统的数据安全保护模式限制了数据流通和开放分享,应当强化对数据滥用行为的刑事规制, 确立以数据利用安全为重心的法律治理模式。 此外, 卫承霏等[43]阐述了全球跨境数据安全治理的多维逻辑与中国应对; 吕明元等[44]从法律、 政策、 行业等方面梳理我国数据安全治理进展; 马海群等[45]对我国数据与算法安全治理现状和前沿动态进行全局性分析。 结合既有研究, 目前, 我国数据要素市场培育在数据保护法律体系、 数据安全监管、数字基础设施建设、 国家数据主权方面仍存在许多不足。
4.1.4 定价策略
聚类4 突出的研究主题为定价策略, 关键文献围绕定价策略设计和定价方法创新展开。 李清逸等[46]、 欧阳日辉等[47]指出, 相比于劳动力、 技术、 资本等传统生产要素, 数据由于具有价值不确定、 非竞争性、 衍生性等特性, 定价机制更为复杂。 定价策略设计上, 刘朝阳[15]认为要对数据的所有权、 使用权和收益权分别进行定价; 熊励等[17]通过对模拟案例的测算, 提出数据产品交易应当基于买方感知价值和卖方成本收益的基础上进行数据要素定价, 平衡买卖双方的效益; 吴超等[48]结合数据高固定成本、 低复制成本的特征,认为传统定价模式和定价策略难以用于数据, 提出数据交易应当根据使用权对数据进行动态定价。
在数据定价方法的创新上, 学者们如刘朝阳[15]、 刘枬等[49]提出了成本法、 市场法、 收益法、 价格区间法等基于会计视角的定价方法, 但由于数据自身成本较难量化、 数据价值可持续挖掘、 数据产品个性化程度高以及市场交易规模较小等因素, 这些方法均存在诸多局限, 难以在具体实践中指导定价。 目前, 数据交易实践中大致使用3 类定价机制: 第一类是市场上使用最频繁的协议定价, 数据买卖双方基于博弈论的原理反复协商来确定最终统一价格。 协议定价操作比较简单, 成交率较高, 但是交易多为卖方主导, 买卖双方易出现信息不对称的情况, 估值易出现偏差且交易效率低下[49]。 第二类是根据数据价值和应用场景, 买卖双方接受交易平台的第三方自动定价, 这类定价方式的关键是最终价格必须是参与博弈的各方所能接受的平衡点。 第三类则是拍卖定价, 数据购买者们对数据价格进行竞拍, 最终以最高竞拍价成交数据。 拍卖定价主要是针对非常优质的数据源, 并面向B2B 交易[50]。 在买卖双方信息不对称的交易环境中, 拍卖是一种形式简单却又能在一定程度上确保公平和效率的方案,在数据定价方法上显示出巨大的潜力[51]。
但以上数据定价机制也存在一定的局限性,协商定价具有较高的自由度, 成交率也很高, 但是买卖双方信息不对称, 估值易出现偏差且协商成本高[52]。 而第三方评估机构所确定的数据评估价格仅为数据交易方提供一定参考, 数据最终成交价格仍需由交易双方进行协商决定, 本质上仍属于协商定价模式, 且数据技术水平要求很高。拍卖定价虽采用市场化的方式确定数据价格, 但仅适用于存在多名潜在数据需求方的情况, 否则难以起拍。 陈仲武等[53]提出一种基于以太坊智能合约的数据要素动态定价模式, 但并未深入研究数据非法转售等问题, 数据版权机制有待完善。从我国数据交易实践来看, 目前我国数据要素市场仍缺少科学合理且实用的数据定价方法, 学界对其研究也未达成统一, 亟待深入研究数据定价方式、 形成规范化的定价机制, 以促进数据要素流通以及价值释放。
4.1.5 市场化配置
聚类5 突出的研究主题为市场化配置, 关键文献主要围绕我国数据要素市场配置化的现状及数据要素市场化配置的内在机理展开论述。 乔晗等[54]基于复杂经济系统管理的组态视角, 探讨了技术、 组织和环境条件对区域数据要素市场化建设的作用机制。 杨艳等[31]指出数据要素市场化配置机制不健全、 交易监管体系不完善及相关法律法规缺失等问题是提高数据要素市场化配置效率的“拦路虎”。 李松龄[55]提出要依据数据要素属性进行分类, 只有具有商品属性和资本属性的数据要素才需要市场化配置。 刘金钊等[56]从建设数据市场统一制度、 推行试点数据分类分级确权机制、探索差异化的定价机方法、 布局多元化的交易市场4 个方面提出了培育高水平数据要素市场的政策建议。 孔艳芳等[57]通过解读数据要素市场的内涵结构和运行机理, 提出数据要素市场建设的实践路径。 黄朝椿[58]指出建设数据要素市场需要遵循从供给侧入手、 坚持顶层设计、 运用市场机制的原则。 王家明等[59]使用PFHWD-TOPSIS 模型对2006—2020 年我国31 个省份数据要素市场化配置效率进行测度, 发现东部发达地区市场化配置效率差异并不明显, 而西部地区数据要素市场配置上存在明显的追赶效应。
结合重点文献和交易实践可知, 目前, 我国数据要素市场化配置水平还有待提高, 建议结合发展实际分层次、 分区域稳步推进建立全国统一的数据要素市场, 充分考虑、 统筹规划各区域的资源禀赋, 选择合适的数据要素市场化建设路径。
4.1.6 数据价值
聚类6 突出的研究主题为数据价值, 相关研究热点主要围绕数据要素价值创造与价值实现路径展开论述。 第一, 从数据要素价值创造过程视角出发, 肖旭等[60]指出流通是数据要素价值形成的必要条件, 数据通过流通才能完成价值的增值与变现。 尹西明等[61]论述了通过建立数据银行实现数据要素多维价值创造的五环节动态过程机制。阳巧英等[62]将数据要素价值创造进程总结为资源化处理、 资产化交易和场景化应用3 个阶段。 何苏燕[63]结合数据要素化实现机理及数据要素特征,提出构建多主体参与、 数据要素驱动、 全要素协同参与的数据要素价值创造机制。
第二, 从数据要素价值实现路径视角出发,黄少安等[64]从数据技术的角度出发, 认为汇集海量数据并保障数据安全, 凭借算法算力等对海量数据进行分析, 是数据要素价值实现的基本路径。陈舟等[65]指出数据交易平台是连接数据供求双方、实现数据交易、 提高数据要素市场化配置效率的核心载体, 削减了“信息孤岛”现象, 促进了数据价值释放, 使数据价值能得到较大程度的发挥。朱瑞博等[24]指出数据要素可通过融入资本、 技术、劳动等传统生产要素来实现价值倍增、 赋能全产业链价值链。 王洪亮等[66]结合我国企业间数据流通实践, 认为有必要赋予第三人访问数据集的权利来增加数据流通的途径以促进数据价值实现。其中, 公共数据由于数量多、 质量相对较高、 标准相对统一等特点[67], 其价值实现路径成为学者们关注的重点。 李刚[68]认为要素价值的释放与公共数据开放程度相关。 彭宗峰[69]基于数据价值形态的演变进程, 研究了如何构建政府开放数据价值治理体系。 雷鸿竹等[70]对我国20 个省级政府数据开放平台进行调研, 探索了政府数据开放价值实现路径。
4.2 前沿动态分析
在关键词共现分析基础上, 运用CiteSpace 5.7.R5 软件, 根据样本文献绘制关键词时区图谱,展示数据要素市场研究主题随时间的变化, 结果见图3。
图3 2012—2022 年我国数据要素市场领域关键词演进图谱
2012—2018 年是我国数据要素市场研究的探索初期, 此时学界多围绕数据开发与交易场景开展研究, 研究重点主要在于数字资源融合的内涵和特点、 数据与信息经济的融合、 个人数据销售许可机制、 大数据交易中的产权问题、 数据交易中心模式及交易监管模式。 此外, 学者们逐渐开始摸索建立数据交易市场, 如赵栋祥等[71]根据从传统信息环境到大数据环境对数据价值认知的演变, 根据数据生命周期和大数据价值链, 提出建立数据集市。
2019—2022 年是我国数据要素市场研究的爆发阶段。 2019 年10 月, 十九届四中全会首次提出将数据作为新的生产要素参与收益分配, 开启了我国数字要素市场建设“2.0 时代”, 数据要素市场化配置成为研究热点以及重难点。 相关文献主要从理论分析入手, 探究数据要素赋能实体经济、数据要素市场的基本构成、 数据要素产权界定与规制、 数据定价机制、 数据要素交易模式及数据治理规则等问题, 以识别我国数据要素市场建设陷入的困境与障碍, 并提出完善路径以及政策建议。
从图3 中可知, 数据要素市场化配置、 数据安全利用保障、 数据分类分级治理以及数据技术创新发展在未来仍是学界研究的重难点所在。
5 结论与展望
5.1 研究结论
基于知识图谱可视化分析方法, 以CiteSpace 5.7.R5 和知网可视化分析为研究分析工具, 本文对我国数据要素市场研究领域进行深入分析, 通过构建和解读知识图谱, 对该新生研究领域发文的分布时间、 高被引文献、 发文热点分布以及未来研究趋势进行了讨论, 为国内数据要素市场进一步的理论研究及应用探索提供理论依据和实践参考。
(1)研究分布特征。 从发文数量上来看, 数据要素市场领域的相关研究在2012—2019 年并不多,但从2020 年起研究热度上升, 发文量急剧增长。从高被引文献来看, 数据权属界定、 数据定价机制及数据交易模式一直都是数据要素市场相关研究的热门方向。
(2)研究主题分布。 在研究热点方面, 我国数据要素市场领域的研究主要围绕着数据要素产权界定、 数字经济与数据要素市场培育的内在联系、数据利用安全保障、 数据定价机制构建、 数据要素市场化配置以及数据价值的开发利用; 随着技术的发展, 研究热点将延伸至大数据、 人工智能和区块链等数字技术领域。
(3)研究发展趋势。 数据资源作为全新的生产要素, 逐渐成为国家战略性资源和社会财富, 我国对数据资源的认识不断深化, 开发利用水平也在不断提升。 党和国家高度重视数据要素市场的建设, 积极推进各地数据交易机构建设, 不断创新发展数据技术。 但当前, 我国数据要素市场建设还面临许多问题和挑战, 如数据确权登记制度尚待确立、 数据定价机制尚不健全、 数据交易规则还有待完善等。 未来, 需要完善数据确权方面的研究, 构建数据交易规则体系、 完善数据评估与定价机制、 加强数据交易新技术研发应用及数据交易所创新发展等。
5.2 研究展望
本文以全局观和动态视角探究了数据要素市场领域的研究热点与演化过程, 以期为该领域高质量发展提供参考。 未来可从以下方面对该领域展开细致研究:
首先, 从研究方法来看, 数据要素市场相关研究目前尚处以案例研究和文献分析为主的初期发展阶段, 实证分析较少。 未来, 相关研究人员可采用多种创新研究方法对该领域进行深入研究,如探究数据定价机制的效率等。
其次, 从研究内容来看, 数据要素市场研究正向更为细化的方向发展。 已有学者提出数据要素市场研究的关注重点不能仅限于数据确权、 定价及市场建设等, 数据供应方的入场意愿、 公共数据专区建设、 数据精炼服务、 数据交易“一站式”监管及密态交易技术等逐渐成为数据要素市场研究领域新的热门方向。 此外, 我国数据交易所建设同质化严重且较为分散, 缺乏全国层面的统筹布局。 未来研究者可围绕上述热点展开更为细致和深入的探讨。
最后, 从研究情境来看, 数据的流通交易离不开算力、 技术、 人才等多种资源的支撑, 然而我国各地经济发展水平与其拥有的要素禀赋存在较大差异, 数据要素市场化配置的能力参差不齐。早期数据要素市场研究主要针对东部发达地区,未来, 需要分层次、 分区域逐步推进全国统一数据要素市场建设。