基于计量分析的我国数据确权政策与科研协同研究
2022-10-08文禹衡付张祎
文禹衡 付张祎
(1.湘潭大学知识产权学院,湖南 湘潭 411105; 2.湖南省高级人民法院—湘潭大学大数据与智慧司法研究中心,湖南 湘潭 411105)
2021年12月,国务院印发《“十四五”数字经济发展规划》指出发展目标,到2025年,数字经济迈向全面扩展期,数字经济核心产业增加值占GDP比重达到10%。数据确权作为数据要素市场培育的基础问题,尚无很好的解决方案。政策层面就数据确权作出较多规定,科研方面也有不少数据确权的成果,然而政策规定与科研成果的协同情况如何不得而知,此二者的协同相互影响着数据确权的政策制定和科学研究的进程。
就数据确权而言,主要涉及数据权利的属性、内容、构造、归属等。①数据权利的属性研究,如张黎、相丽玲等认为数据确权包括数据人格权和数据财产权,而国内现处于个人数据单向保护框架的立法现状,个人数据财产权保护将是未来研究重点[1-2];姬蕾蕾认为,数据权利属性应该协调兼顾个人数据保护和大数据开发利用,而不是过分地对个人数据隐私进行人格权保护[3];Aksoy H C认为在欧洲,个人数据被视为数据主体人格权的一部分[4];②数据权利的内容研究,如何培育等、王茜茹等在介绍欧盟、美国被遗忘权立法状况的基础上,提出被遗忘权本土化构建的建议[5-6];化国宇等论述了数据可携带权的积极作用以及权利属性建构的缺陷、价值目标实现的不确定性等权利自身缺陷,继而提出了数据可携带权本土化调试的建议[7];Janis W等向不同数据控制者提出230个数据可携权请求,发现其实际运行中存在的问题,并从技术角度重新审视了携转数据要求的“结构化、通用性和机器可读”标准[8];③数据权的构造研究,如文禹衡认为,“数据产权”是数据确权后最合适的概念[9],构建了用户的数据控制权和企业的数据经营权二元结构[9];申卫星认为,根据不同主体对数据形成的贡献来源和程度的不同,应当设定数据原发者拥有数据所有权与数据处理者拥有数据用益权的二元权利结构[10];④数据权利的归属研究,如姬蕾蕾认为,应当立足于劳动正当论,赋予数据产业者数据所有权[11];王玉林等认为,应赋予数据原权利人数据权利,但同时应当加以限制,不得侵害他人个人数据、智力成果和商业秘密[12];王东方认为,个人数据权归属于数据生成主体,表征的是数据生成主体之人格利益[13];Dosis A等认为,数据权利的归属取决于数据的价值,或者等效地取决于生成数据的市场与使用数据的市场之间的相对权重[14]。
就数据领域的协同研究而言,主要涉及运用政策文本计算、政策量化赋值、政策机理分析以及单元对比分析等方法分析数据开放政策协同。①政策文本计算的协同研究,如周环等对隐私政策中数据开放和隐私保护的主题分布与共现强度加权计算得出主题协同度[15],张涛等对政策中开放数据和数据安全的主题分布、共现强度、政策力度加权计算得出主题协同度[16];②政策量化赋值的协同度研究,如洪伟达等从政策强度、政策目标和政策工具维度设计政策量化标准,构建度量模型分析协同情况[17];张玲玲从政策力度、政策目标、政策协同维度量化赋值,分析《促进大数据发展行动纲要》和《大数据产业发展规划(2016—2020年)》是否协同、如何协同及协同度如何[18];毛子骏等通过文本内容进行结构化并赋值的方式,计算政府数据开放政策中“政策目标”与“政策措施”的协同度[19];③政策机理分析的协同研究,如洪伟达等以政策系统论为指导,分析我国开放政府数据政策体系子系统和各要素之间的协同演化过程,揭示开放政府数据政策系统的协同运行机理[20];④单元对比分析的协同度研究,如姜鑫等从科学数据开放政策和个人数据保护政策两类政策群中选取若干标杆政策,运用内容分析法构建两类政策群之间政策协同观测的政策文本内容分析单元,以此对比分析两者的协同度[21]。
综上,不乏数据确权的研究,也不乏展开协同研究的方法,尚没有关于数据确权协同的研究成果,意味着本研究具有相当的创新空间,现有协同研究的成果能够为本研究提供参考和启示。首先,从研究领域来看,协同研究也同样适用于数据领域,但其大多仅涉及数据开放,未涉及作为基础问题的数据确权;其次,从数据相关协同研究文本来看,其大多仅限于政策文本之间,但未涉及同样具有协同关系的政策文本与科研文献之间的研究;最后,从现有数据相关协同研究的方法来看,基于文本计量、文本计算的协同研究方法可行,但还没有基于关键词词频、突现的文本计量方法的协同研究成果。
1 研究设计
1.1 样本获取
为了实现政策规定与科研成果协同研究,选择与数据确权相关的政策文本和科研论文为样本。政策文本是政策规定的直接载体,可以作为研究政策规定的样本。之所以选择科研论文作为研究成果的样本,是考虑到两个因素:其一,相比较于专著、研究报告等科研成果,科研论文更能及时反映科研方面的最新动态;其二,科研论文的数量规模相对更大,且质量通过严格的同行评价。于2021年12月5日—8日分别以Wolters Kluwer法律信息库和中国知网作为数据来源,分别收集和整理涉及“数据确权”的政策与论文。
由于当前并没有在标题中标明“数据确权”的专门性政策,因此以检索式——“数据 确权”~4进行全文检索,该检索式表示命中结果满足以下两个条件:①同时包含“数据”和“确权”,且两词的命中满足先“数据”后“确权”的顺序;②“数据”与“确权”之间,间隔字数小于等于4,以此确保“数据资源确权”“数据资产确权”等与“数据确权”实质内容相同的类似表述也包含在命中结果内。按照以上检索式,得到5个行政法规、21个部门规章和102个地方性法规(Wolters Kluwer在分类中将地方性法规、规章、党的政策都归为一类,统称为地方性法规)。
由于科学研究对于“数据确权”的概念范围、称谓等与政策相比更加宽泛,因此以检索式——“数据*权”——在中国知网进行篇名检索,该检索式表示命中结果的篇名中同时存在“数据”和“权”,为了尽可能获取与数据确权相关度高的文献,故选择篇名进行检索。数据确权包含数据权利属性、数据权利内容、数据权利归属3个方面,因此,以该检索式检索相关文献时能够完整包含上述3个方面,例如“数据被遗忘权”“数据权利”和“数据权属”等相关内容都包含在内,尽可能在获取“数据确权”相关文献时确保查全率和查准率。按照以上检索式,得到906篇科研论文。
1.2 数据处理
选择CiteSpace作为分析工具,可以直接分析科研论文,但无法直接分析政策文本,故先运用扎根理论方法处理政策文本。在计量分析数据确权的政策文本和科研论文时,以关键词作为文本统计分析的对象,确定特定样本的重点领域和主题,再结合词频、突现等方法分析研究热度、重要性以及关联度,进而完成政策和科研对比分析,得出其协同情况。
获取政策样本时,通过以下步骤人工筛选出与“数据确权”以及本研究目的相关的政策。第一步,通过人工查看各样本中的对应语句,将仅文字顺序符合检索式但实质内容与“数据确权”无关的样本剔除。例如,《河南省住房和城乡建设厅关于开展应急预案体系建设情况调查的通知》中命中的语句为“确保相关数据准确权威”,由于此类语句也符合检索式——“数据 确权”~4的条件,因此也在搜索的结果中,但要通过人工筛选去掉。第二步,多个内容相同的文本只保留正文文本,例如《宁夏回族自治区人民政府关于印发〈宁夏回族自治区“互联网+教育”示范区建设规划(2018—2022年)〉的通知》和《宁夏回族自治区“互联网+教育”示范区建设规划(2018—2022年)》,由于两者实质内容相同,因此只保留正文文本。第三步,将样本中的“征求意见稿”剔除。征求意见稿并不是最终文本,条文本身未来可能会发生变化,不排除会有新增、删除、修改的可能。由于征求意见稿并不具有稳定性和确定性,并且其数量占比甚小,不纳入样本范围也不影响研究结果,因此在样本处理中将征求意见稿剔除。完成上述筛选步骤后,共获得76件数据确权相关政策。由于上述政策并非数据确权的专门性规定,因此为了使样本与“数据确权”的相关性更大,并非使用全文作为分析样本,而是基于扎根理论的方法提取关键词作为样本,再进行文本量化分析,这种做法已经在相关研究中得到检验[22]。具体而言,先在“数据确权”词汇的相关语段中运用扎根理论方法提取出数据相关的词汇作为关键词,提取关键词时尽可能使用原文表达以确保客观性,再按照CiteSpace要求的文件格式将关键词进行编排,最终得到政策的分析样本。
获取科研样本时,通过以下步骤人工筛选出与“数据确权”以及本研究目的相关的文献,以确保分析结果更具针对性和准确性。第一步,限定在中文科研期刊文献范围,本研究目的在于分析我国数据确权科研与政策的协同,因此只选择我国的科研成果。第二步,人工筛选剔除虽然满足检索式,但与数据确权完全无关的科研文献,例如“农地确权与农村劳动力就业选择——基于CLDS数据的实证分析”和“大数据时代马克思主义意识形态话语权的建构”等。第三步,由于数据确权仅涉及“数据权利”,因此将诸如“网络数据长臂管辖权——从‘最低限度联系’标准到‘全球共管’模式”等涉及“数据权力”的文献剔除。完成上述筛选步骤后,共获得258篇数据确权相关论文。
2 研究结果
2.1 政策文本
2.1.1 关键词分布
通过统计共获得政策文本的137个关键词,由于大多关键词出现频次过低,不具有研究上的代表性,因此仅选取TOP20高频关键词形成表1,TOP20高频关键词的词频数占总词频数的54.03%,且该表中最低词频已到5,可见在计量分析时排除TOP20之后的关键词,对分析结果影响很小。如表1所示,政策总体上比较务实,侧重于推动数据利用,即主要集中在数据的交易、流通、开放和共享等数据价值释放方面,其频次占前20个关键词总频数的42.71%。2020年我国数字经济规模达到39.2万亿元,占GDP比重为38.6%,目前位居世界第二,其增速达到GDP增速3倍以上,成为稳定经济增长的关键动力,数字经济已成为我国经济中不可或缺的重要部分。政策重视“数据交易”符合数字经济的态势,数据的交易流通能够有效助力数字经济的发展,而想要实现数据的有序交易流通,其前提就是数据确权。
表1 数据确权政策的TOP20关键词词频
从关键词的年度分布变化来看,如图1所示,随着2015年国务院印发《促进大数据发展行动纲要》,“大数据”及相关概念便开始在政策中大量出现。“数据确权”一词也于2015年首次在政策中出现,起初与其伴随的关键词基本都属于“数据交易”相关概念,但2017年后“数据安全”便开始出现,并在2018年出现“数据信息安全”、2019年出现“隐私保护”、2020年出现“数据要素”。随着数据带来的经济利益不断增加,数据被过度地收集、利用,引发出一系列数据安全、隐私、个人信息等负外部性问题,政策也开始注意到数据流通和数据保护的平衡问题,对数据保护方面加以规定。然而,只有实现数据确权,才能界清权利、义务与责任,进而有效实现数据保护。2019年党的十九届四中全会首次将数据与劳动、资本、土地、知识、技术、管理并列作为生产要素,由市场评价贡献、按贡献参与分配。随着2020年中共中央、国务院公布《关于构建更加完善的要素市场化配置体制机制的意见》,明确把“数据”与土地、劳动力、资本、技术并列为生产要素,提出加快培育数据要素市场,政策关键词中也随即出现了“数据要素”“数字经济”“数据要素市场”等相关主题词。从近几年出现的关键词中可以发现,数据确权及其相关问题正在被不断细化。例如,逐渐出现医疗数据、教育数据、政务数据、公共数据等数据权利客体的细化分类,对不同类型的数据分类分级,从而进行不同的确权与保护;又如,近年来不断出现区块链、数据沙盒实验等技术确权方案,都是对数据确权等问题多角度的积极尝试。
图1 数据确权政策的关键词年度分布
从数据确权政策关键词中可以发现,数据确权政策中出现的关键词基本可以涵盖绝大多数的数据问题。这说明政策就大部分的数据问题作出规定时,“数据确权”仍是无法回避的,进一步体现了“数据确权”的基础性地位。在数据确权政策关键词中,“数据交易”的词频最高,可以看出政策中“数据交易”与“数据确权”之间的关系最为密切,“数据确权”对于解决“数据交易”问题来说也最为基础。当前,全国已有多地开设数据交易所,而实践中正面临确权难、定价难、互信难、入场难、监管难等共性难题,而数据确权问题作为数据交易的前提更是当务之急。
2.1.2 关键词突现
Burst Detection功能能够呈现我国政策中“数据确权”相关关键词的突现排名,用来检测短时间内发生急剧变化的主题内容,为了能够完整呈现政策热点的变化趋势,因此取全数据确权政策突现关键词(共16个),进而得到政策中“数据确权”相关热点及前沿,如图2所示。图2中红色区域为各热点的活跃年段,左侧按突现时间先后进行排列,右侧按突现强度进行排列。
图2 数据确权政策的关键词突现
从图左的政策热点变化中可以发现:首先,“数据确权”相关政策热点正从数据交易等转向数据安全,这与前述年度分布分析结果相同,可以看出当下政策对于数据保护、隐私保护越来越重视;其次,从近年来诸如“数据治理”“数字政府”等前沿热点也可以看出,当下我国政策对于数字中国建设的重视。
从图右的政策突现强度排序能够发现:首先,自2015年至今,突现强度最高的是“数据产权保护”,其包括数据产权和数据保护两个方面。数据产权需要通过确权来界定,合理平衡数据开发利用中的私人利益与公共利益,既要保护个人数据安全和激励企业投资创新,也要鼓励数据流通利用和开放共享,促进数字经济创新发展,因而数据确权对数据要素市场交易和个人数据保护都构成重要的影响,是数据市场建设和促进数字经济创新发展的重要的基础性制度问题[23];其次,从近两年的突现强度来看,最高的是“隐私保护”和“数据治理”,由于此处的“隐私保护”出现在“数据确权”相关语句,故此处的“隐私保护”应理解为对数据所载的隐私信息保护,也能够概括在数据保护、信息保护之下。可以看出,政策对于数据不再只注重其经济价值,对于数据安全价值也逐渐重视,但政策对于数据确权还缺乏具体规定,导致实践中权利归属、救济方式等不明确,使得数据未能得到有效保护。
2.2 科研论文
2.2.1 关键词分布
CiteSpace对“关键词”的统计包括文献的关键词和篇名中出现关键词的频次,因此以下关键词的频次统计包括上述两部分。在文献的关键词分布中可以发现,相比于政策中的关键词,文献中的关键词概念表达更为丰富、用词更为准确,对概念的研究更加细化,体现了科学研究的严谨以及对不同概念的深入理解。经过统计共获得科研文献的188个关键词,由于大多关键词出现频次过低,不具有研究上的代表性,因此仅选取TOP20高频关键词形成表2,TOP20高频关键词的词频数占总词频数的56.70%,且该表中最低词频已到9,可见在计量分析时排除TOP20之后的关键词,对分析结果影响很小。“数据确权”相关文献的关键词分布如表2所示,可大致归类为以下几个方面。
表2 数据确权文献的TOP20关键词词频
①“大数据”和“大数据时代”归为一类,“大数据”词频是所有关键词中最高的,“大数据”一度成为当今科研领域最大热点,但“大数据”“大数据时代”在绝大多数文献中并非研究对象或问题,而只是将“大数据”作为研究背景,甚至当下许多与数据无关的文献也提及“大数据”一词;②“被遗忘权”“数据可携权”“个人数据权”和“数据产权”概念都属于数据确权中的数据权利内容,其中“被遗忘权”和“数据可携权”是“数据权利内容”中的研究重点,科研领域对其是否“本土化”存在分歧;③“数据确权”“数据权利”“数据权”和“数据权属”归为一类,其都属于数据确权的基础问题,其中“数据权属”在不同文献中根据不同的语境有数据的“权利属性”和“权利归属”两种含义;④“个人信息保护”“个人信息权”“个人信息”“隐私权”都属于“个人信息”范畴,从个人信息所包含的内容来看,其中一部分信息属于隐私信息的范畴[24];⑤“数据安全”“数据保护”和“保护路径”归为一类,数据权属不明晰的情况下难以界定权责,不但不利于数据的安全保护,也不利于数据的交易流通;⑥“个人数据”单独作为一类,其作为数据权利的客体类型之一,是数据确权研究的重要对象,当前绝大部分研究成果都是围绕个人数据展开;⑦“数据流通”单独归为一类,数据流通能够加强数据的开发利用,但数据必须在安全的前提下流通,以实现数据利用与数据安全之间的平衡;⑧“本土化”单独归为一类,尽管我国对欧盟和美国的相关数据法律制度研究较多,但并不意味着需要完全移植,而是根据实际情况进行本土化。
以上分类中,词频总和最高的3位分别是数据权利内容、数据确权基础问题、个人信息相关问题,可见科研领域对数据确权研究更加关注保护数据主体的利益,尤其是数据主体的人格权益。总的来说,科学研究比较关切现实问题,当下数据主体与数据控制者地位极度不平衡,数据控制者事实上控制着个人数据,数据主体需要法律赋予相应的权利才能实现对其个人数据的控制。
如图3所示,从关键词的年度分布可以发现,科研领域关于“数据确权”及相关内容的研究较早,2013年就出现了“数据确权”一词。纵观各年出现的关键词,能够看出我国科研领域对于“数据确权”及相关问题以研究国外相关法律制度为主,尤其是欧盟的数据立法对我国数据确权研究影响很大。《通用数据保护条例》(General Data Protection Regulation,GDPR)于2016年通过,2018年生效实施,图3中2016年开始出现的“gdpr”和2018年开始出现的“一般数据保护条例”与GDPR通过和生效的时间点高度一致,反映我国科研领域对国外数据相关立法的关注程度和跟进速度。我国科研领域在数据确权方面并非主张完全借鉴国外相关研究,而是随着研究的不断深入,探讨其“本土化”(2019年)的必要性以及构建路径。近两年,数据确权及相关研究也出现了数据交易、数字经济等更加关注现实需求的研究方向,数据确权等相关问题的研究角度也越来越多元化,不只局限于从法学理论上展开研究,还引入了区块链、算法规制等视角,使数据确权等相关研究更加具有交叉性。
图3 数据确权文献的关键词年度分布
2.2.2 关键词突现
图4中红色区域为各热点的活跃年段,为完整呈现科研热点的变化趋势,因此取全数据确权文献突现关键词(共29个),图左按突现时间先后排序,图右按突现强度排序。
图4 数据确权文献的关键词突现
从图左的科研热点变化中可以发现:首先,尽管近两年开始,数据确权研究出现了数据交易等关键词,但关于数据安全、数据保护的研究贯穿始终,其依然是当下数据确权问题的研究热点,并且研究更加频繁;其次,自2018年《一般数据保护条例》生效实施至今,相关内容便成为我国数据确权问题的研究热点,可见《一般数据保护条例》对我国科研影响之大;最后,从近些年的研究热点可以发现,当下科研紧跟社会热点,随着数据所带来的经济价值不断释放,“数据之争”“数据孤岛”“数据泄露”等问题在企业中频频发生,其凸显“信息保护”“数据保护”“个人隐私”“不正当竞争”和“数据权属”等问题,可见当下科研以社会现实问题为导向。
从图右的文献关键词突现强度排序可知,不管是从近两年来看,还是从总体上看,“数据权属”都是数据确权相关关键词中突现强度最高的。当前数据权利属性的研究主要有物权、知识产权、隐私权、新型权利等观点,不同的数据权利属性意味着不同的数据保护及救济模式,产生不同的数据流通效果。当前数据权利归属的研究主要集中在个人数据的权利归属,由于个人数据兼具财产利益和人格利益,因此不能将数据权利完全归属于企业,否则将可能侵犯到数据主体的人格利益,但绝对地将权利归属于数据主体,又会影响企业供给数据产品和服务的积极性。当下的“数据之争”和“数据泄露”越发突出,严重影响数据的保护与流通,确定数据权利属性和归属,正是数据确权的基础性问题所在。
3 研究结论
3.1 关键词分布的协同分析
3.1.1 协同领域分析
结合表1和表2的高频关键词来看,数据确权政策更侧重数据交易等现实问题,进而推动数字经济发展;科学研究更偏向数据权利内容研究,探索如何平衡数据主体对人格利益的控制支配和数据控制者对财产利益的经营收益。为进一步分析数据确权政策与科研之间的协同情况,以表1和表2的关键词为基础,剔除“互联网”“本土化”等与数据确权不相关的关键词,运用扎根理论方法分别对政策文件和科研文献的TOP20关键词进行编码合并,得到表3。在合并时,以邻近关键词或其上位概念为范畴,例如将政策文件中的“数据交易”“数据流通”“数据交换”合并为“数据流通”,又如将科研文献中的“被遗忘权”“数据可携权”“个人数据权”“数据产权”合并为“数据确权的具体权利”。分析可知政策与科研之间的协同领域情况:基于“大数据”的背景,数据流通、数据安全、数据类型和个人信息保护方面实现了协同,而在数据开放共享、数据服务、数据定价、数据管理、数据资产、区块链、数据确权的具体权利和数据确权等方面未实现协同。
表3 数据确权政策与科研的协同领域
3.1.2 协同时间分析
以图1和图3的关键词和时间线为基础,剔除“互联网平台企业”“去识别化”等与数据确权不相关的关键词,运用扎根理论编码后合并,得到图5。分析可知政策与科研之间的协同时间情况:①至2015年,政策与2013年首次出现数据流通、数据资产、数据确权和大数据的科研实现协同;②2016年和2017年,政策与2013年首次出现数据价值、数据安全的科研分别实现协同;③2018年,政策与2013年首次出现个人信息保护、数据类型的科研实现协同,科研与2016年首次出现数字技术的政策实现协同;④数字经济的政策与科研协同最快,2020年出现即实现协同;⑤科研和政策中首次出现的其他主题领域还没有实现协同。整体而言,数据确权的科学研究比政策规定要早得多,除了数字技术先在政策中出现、数字经济同时在政策和科研中出现以外,已协同的领域都是2013年首先出现在科研中,意味着在数据确权领域是科研引领政策的走向,这符合科研探索前沿、政策稳步跟进的现实情况。
图5 数据确权政策与科研的协同时间
一旦政策规定和科学研究相互之间出现协同,就会互相影响各自发展。绝大部分数据确权及相关问题都是由科学研究先展开,当该类问题在现实中越发重要时,政策便会对该类问题作出规定,然后该类问题又可能会再次成为科研的研究重点。因此,图4中的协同时间仅考虑首次出现之后的首次协同,而不需要考虑之后的再次协同。例如,“数据确权”于2013年首次在科研中出现,政策于2015年与其首次协同,尽管其于2018年又再次出现在科研的时间轴,2020年又再次出现在政策的时间轴,但此时并不需要考虑2018年科研与2015年政策、2020年政策与2018年科研的协同问题。
3.2 关键词突现的协同分析
3.2.1 协同热点分析
以图2和图4的图右为基础,剔除“演化博弈”“循证政策”等与数据确权不相关的关键词,运用扎根理论方法分别对政策文件和科研文献的突现关键词进行编码合并,在合并时同样以邻近关键词或其上位概念为范畴,得到表4。分析可知政策与科研之间的协同热点情况:数据安全、数据流通、数据类型、信息保护、数据价值和数据资产方面实现了协同,而在数据开放、数据交易中介、数据服务、数字政府、数据治理、大数据标准体系、数据确权、信息自决、信息资产、大数据、不正当竞争等方面未实现协同。
表4 数据确权政策与科研的协同热点
结合图2和图4可知,政策规定和科研文献中突现强度最高的分别是“数据产权保护”和“数据权属”,尽管从字面意思理解,此二者都属于数据确权范畴,但“数据产权保护”在政策中更侧重于“保护”,属于数据安全范畴,因为政策还没有关于“数据产权”的具体规定。因此,政策和科研在数据确权的热度方面是不协同的。结合协同领域的分析结果可知:在关键词分布和词频突现中,都实现了协同的有数据流通、数据安全、数据类型、信息保护,都没有实现协同的有数据确权、数据开放、数据服务。
需要说明的是,在协同领域和协同热点方面没有同时协同的情形有两种。其一,在协同领域表现协同,而在协同热点表现不协同。例如,“大数据”作为政策和科研共同的时代背景,虽然在关键词分布中出现协同,但从词频突现来看,科研对“大数据”的关注热度远高于政策,即此二者在“大数据”的关注度上出现不协同。其二,在协同热点表现协同,而在协同领域不协同。例如,“数据资产”是政策与科研短期内的共同热点,故在词频突现上出现协同,但从完整时间周期来看,科研上的“数据资产”词频远低于“数据安全”相关关键词词频,导致“数据资产”词频未能进入TOP20,故在关键词分布上出现不协同。
3.2.2 协同趋势分析
以图2和图4的图左为基础,延用协同热点分析时的编码和合并得到的范畴,按照时间线形成图6。从该图的最近一年开始逐年往前回溯,可以分析出协同趋势。
在科研方面,数据安全自2013年首次出现后,数据确权自2013年首次出现后(除2015—2017年停滞外),信息保护自2018年首次出现后,不正当竞争自2019年首次出现后,延续至今;数据确权的具体权利和数据类型自2013年首次出现之后均延续到2017年,数据价值和数据资产自2013年首次出现之后均延续到2015年;数据流通、信息资产、信息自决分别于2013年、2016年和2018年首次出现之后仅延续到了第二年。可见,科研方面的数据安全和数据确权是研究中的“重点恒重”,信息保护和不正当竞争是新兴的研究主题。
在政策层面,信息保护和数据治理自2018年首次出现之后均延续至今,数据流通自2015年延续至2017年,数字政府、数据类型和数据安全均自2018年首次出现之后延续至第二年,数据交易中介、大数据标准体系、数据服务、数据资产均自2015年首次出现延续至第二年,数据价值、数据开放分别自2016年、2017年首次出现之后延续至第二年。可见,政策层面的趋势并不稳定,近些年来在信息保护和数据治理方面具有相对连续性,意味着重视安全。
综上,数据确权的政策规定与科学研究的趋势总体上是不协同的,仅在信息保护方面具有较高的协同趋势,意味着数据确权的理论研究和实践应用之间尚未有机融合,但重视“安全”是政策规定和科学研究的各自趋势。
4 对策建议
4.1 政策层面:加快规定数据确权的具体内容
尽管我国《网络安全法》《数据安全法》《个人信息保护法》中对数据、个人信息相关内容有所规定,即便《个人信息保护法》专门设置了个人信息权利条款,但是均未涉及到数据确权。贵州、天津、海南、山西、吉林、安徽、山东、福建、黑龙江、辽宁、深圳、上海、重庆、浙江等省市出台了大数据条例或数据条例,但仅有贵州、上海、深圳和黑龙江等对数据权属有间接的、概括性的规定。可见,立法上对于数据确权仍然是保守和审慎的,而这正是政策发挥其作用的空间。从当前数据确权政策的数据交易、数据流通、数据开放、数据共享、数据安全、数字治理等相关关键词来看,重点在于数据利用和数据保护,而非数据确权本体问题。然而,数据确权问题不解决,难以实现数据有序交易和数字经济持续增长。在数据生产要素时代,相关政策应该着力于解决数据确权本体问题,可以从数据权利的属性、内容和归属3个方面展开。
其一,正视数据权利属性,数据荷载人格利益和财产利益,政策在释放数据财产利益满足市场主体需求的同时,应该考虑个人的数据人格利益需求;其二,界分数据权利内容,不能停留于“数据确权”倡导,而是应当按照现实需求逐步界分诸如经营数据的权利、控制数据的权利等具体权利内容;其三,明确数据权利归属,注重平衡企业和用户之间的利益诉求,企业在经营数据资产期间对数据要素享有相对性占有、生产性使用、自主性经营和增量性收益的权利,赋予用户对个人数据处理的拒绝、删除和可携的权利[9]。根据当前数据治理的经验、数据交易的实践,在政策层面先行先试数据确权,引导相关主体开展具体实践,探索有利于整个数据产业、兼顾利益平衡的数据确权方案,不仅能推动数字经济的可持续发展,更能为今后的数据确权立法提供实践经验。
4.2 科研方面:加强数据确权与数据交易融合
在政策层面中,数据交易与数据确权联系最紧密,政策之所以重视数据交易,是因为其是推动数据要素市场建设和数字经济发展的核心问题。尽管相对于政策规定,数据确权的科研成果出现的时间更早、数量更多,也不乏数据交易的研究成果,但数据确权和数据交易的研究相对独立、缺乏融合,从前述研究结果可见数据交易、数据确权尚未实现科研与政策的协同。数据交易应该置于确权前提之下,数据确权应该置于交易场景之中。在市场经济条件下,数据确权是市场机制发挥作用、优化资源配置的基础性条件,是数据交易有序进行的前提条件,能够有效保障数据生产要素自由流转,实现数据资源的最佳配置[25]。反过来看,当实现了数据交易的安全有序、成本最小值时,才能实现数据资源的最佳配置,也就实现了最佳的数据确权。因此,应当从多方面加强数据确权和数据交易实践的融合研究,构建有利于推动整个数据交易行业的数据确权方案。
例如,应当加强数据交易中介服务涉及的数据权利研究。我国《数据安全法》第三十三条就数据交易中介服务机构作出了规定,当前我国除传统的数据交易所、数据交易中心外,广东和上海于2022年5月开启了新的数据交易中介服务探索实践,即广东省政务服务数据管理局批准同意率先推出全国首批“数据经济人”名单、上海市人民政府作出同意组建上海数据集团有限公司的批复。然而,我国科研领域目前对数据中介服务机构的研究非常少,就当前数据交易实践需求来看,关于数据交易中介服务机构的权利、义务和豁免情形,以及在提供服务过程中如何保护各方主体的数据权利等问题亟待理论回应。
再如,应当加强数据交易实践中的数据权利实证研究。科研方面不乏从整体上研究数据权利的相关成果,关于数据删除权、数据可携权等具体权能的研究成果也较多。但是,数据权利及其具体权能在数据交易的商业实践中如何被认知、如何配置等问题,却很少有研究成果[26]涉及,数据确权理论研究成果是否符合数据交易实践逻辑也就难以得到有效检验。因此,应当注重在实践中归纳和提炼数据权利理论和模型,为优化数据确权理论提供有力支持。