基于三维框架的我国科学数据政策文本内容分析
2024-06-17王流芳荣注瑶贾晓峰胡志民
王流芳 荣注瑶 贾晓峰 胡志民
摘要:[目的/意义]分析我国国家层面发布的科学数据政策文本,描述国家层面政策部署特征,以期更好地把握科学数据政策的发展趋势,为我国科学数据相关政策的制定提供重要参考。[方法/过程]构建“政策工具—政策主体—数据生命周期”三维立体分析框架(即X维度、Y维度和Z维度),运用内容分析法与政策文本计量法对我国2005—2022年国家层面发布的106份科学数据政策进行解构和量化分析。[结果/结论]在政策工具维度基本形成“权威工具+能力建设工具”的分布模式;国务院、科技部、人民代表大会作为主要政策主体对科学数据统一规划和管理;政策致力于推动数据利用和共享,同时也在加大对科学数据发展的基本能力建设的投入。需要注意的是:激励工具、象征及劝诫工具缺位比较严重,且政策工具内部结构不够均衡;国务院、科技部、人民代表大会在科学数据管理方面负担较重;目前政策对数据获取、数据处理阶段的部署较少。建议适当增加激励工具和象征及劝诫工具的使用占比,优化各类型政策工具内部结构,切实简政放权,合理调节政策主体压力,加强科学数据全生命周期管理。
关键词:科学数据;政策文本;三维框架;内容分析
分类号:G250
引用格式:王流芳, 荣注瑶, 贾晓峰, 等. 基于三维框架的我国科学数据政策文本内容分析[J/OL]. 知识管理论坛, 2024, 9(2): 177-194 [引用日期]. http://www.kmf.ac.cn/p/386/. (Citation: Wang Liufang, Rong Zhuyao, Jia Xiaofeng, et al. The Text Content Analysis of Chinese Scientific Data Policy Based on Three-Dimensional Framework[J/OL]. Knowledge Management Forum, 2024, 9(2): 177-194 [cite date]. http://www.kmf.ac.cn/p/386/.)
随着数据密集型计算成为新的科研范式,科学数据成为科研创新的动力源泉。科学数据政策作为科研管理的重要组成部分,对于促进科技创新和推动科研成果转化具有重要意义。自1958年起,我国陆续出台了一系列促进科学数据共享的政策和措施[1-2]。2005年之后,我国国家层面开始出台法规政策对科学数据的发展进行顶层设计,随后科学数据相关标准规范、安全管理、平台建设、成果转化法等政策相继出台。2022年12月,国务院发布《关于构建数据基础制度更好发挥数据要素作用的意见》提出20条政策举措,为加快构建数据基础制度体系,进一步释放数据要素价值,激活数据要素潜能指明了方向[3]。随着科学数据政策体系的逐渐完善和丰富,掌握政策脉络、政策演进以及政策部署趋势,对于进一步把握科学数据政策、推进政策完善制定具有重要意义。
然而,国内关于科学数据政策的研究主要集中在国内外政策的比较研究、政策解读和特定领域政策分析,以及对我国各层面发布的科学数据未分层级的政策文本量化分析。笔者构建“政策工具—政策主体—数据生命周期”三维立体分析框架,运用内容分析法与政策文本计量法对2005—2022年间的106份国家层面科学数据政策文本进行解构分析,首次对我国国家层面发布的科学数据政策特征进行分析,并且使用与以往许多研究不同的政策工具视角,以期呈现我国国家层面科学数据政策部署全貌,并提出政策优化策略。
1 研究现状综述/ Review of current research
随着科学数据管理活动的不断发展和管理政策研究的细化,国内外学者都将研究重点落在政策体系框架的构建上,将研究热点集中在从利益相关者、各类政策影响因素的角度构建政策制定框架。但也存在着以下区别:
国外科学数据政策研究倾向于针对现有政策进行调研、评估政策效果和分析政策影响因素。例如,J. F. Gaba等[4]从不同角度针对临床数据的管理政策进行调研,发现现有政策的不足并提出完善的建议;A. Martan等[5]对丹麦15名卫生数据政策制定的利益相关者进行半结构化访谈,并对访谈记录进行定性分析;J. ?tebe等[6]以国际知名的资源描述和检索(resource description and access,RDA)数据政策标准为基础,描述斯洛文尼亚科学期刊中RDA研究数据政策框架的实施情况;N. Waithira等[7]概述数据管理和共享政策的要素,提出机构、部门或小组的数据管理和共享政策是鼓励研究人员和医疗保健人员共享数据的前提;E. van der Marel等[8]汇编出加权指数来评估世界上一些国家在2006—2016年发布的数据规范政策的限制程度,发现限制性数据政策与数据密集型服务贸易呈现显著的负相关性;A. M. Rousi等[9]分析了各个领域内科学期刊的数据管理政策,发现不同研究领域之间的政策内容、强度等存在相当大的差异。
我国学者更倾向于分析国外政策案例、划分政策利益相关者、对研究政策的相关论文进行综述等。例如,马合等[10]通过系统梳理欧美各国重大的科学数据政策,提出我国应构建多方面多层次的政策体系、发挥科研资助机构在政策制定和执行中的重要作用;张红亮[11]阐述英国非政府机构、政府部门、大学机构三类组织的科学数据管理相关政策,对其数据政策内容及特点进行分析总结;王芳等[12]从政策发展历程、政策利益相关者责任、政策主题相似度及关键内容要素等方面对美国、英国、澳大利亚和中国的181份科学数据管理政策进行分析比较;王颢燃[13]从数据生命周期和利益相关者角度对中英两国7个政策进行比较,找出我国政策存在的不足并提出建议;姜鑫等[14]针对参与开放科学数据的众多利益相关者之间的政策协同问题展开研究,为完善各利益相关者制定的政策提出建议;郭仕琳[15]引入行动者网络理论和利益相关者理论对利益相关者进行明确,并分析其利益诉求,提出科学数据开放共享利益平衡机制的构建原则与建议;宋永辉等[16]选取科学数据政策相关论文作为研究对象,分析国际与国内该领域的研究热点与演化趋势。
整体来看,国内外学者对特定国家层面的科学数据政策文本量化分析比较少,在探索国家层面政策特征及部署趋势方面还有很大的研究空间。此外,我国学者在利用政策工具分析科学数据政策时大多数使用R. Rothwell等提出的分类法,即供给侧、需求侧、环境侧。例如,司莉等[17]基于供给型、环境型、需求型政策工具视角,结合利益相关者和生命周期理论构建三维框架,对国家和地方的科学数据管理政策的内容结构进行分析;霍倩等[18]选取13份我国地方政府发布的科学数据管理实施细则,运用供给型、环境型、需求型政策工具进行分析并提出启示。
与以往研究不同,笔者构建“政策工具—政策主体—数据生命周期”三维分析框架基于的政策工具是参考L. M. McDonnell和R. F. Elmore[19]、A. Schneider 和 H. Ingram[20]的分类理论,即权威工具、激励工具、能力建设工具、象征及劝诫工具、系统变革工具。以不同的政策工具视角,基于三维框架对我国国家层面发布的科学数据政策文本进行研究,探索我国科学数据政策优势和不足,为今后从事科学数据政策研究的学者提供基础参考。
2 数据来源与研究方法/ Data sources and research methods
2.1 数据来源
统计“中国科技资源共享网”和20个国家科学数据中心官网的“政策文件”和“政策法规”栏目中的有关政策,确定我国科学数据政策涉及的大体范围[21-22]。以“科学数据”“科研数据”作为关键词,在政府网、国家卫健委、科技部官网以及国家法律法规数据库、北大法宝数据库等检索国家层面科学数据政策文件,政策收录时间截至2022年12月31日。此外,还利用政策文本关联性进行回溯检索,避免遗漏。通过以上来源,收集到政策文件350份。
为确保政策文本的代表性,笔者还确定了纳入和排除标准。纳入标准如下:①在政策文本中搜索“数据”关键词,有“数据”关键词的政策纳入精读,根据上下文语境判断其“数据”关键词是否符合《科学数据管理办法》(国办发〔2018〕17号,以下简称《办法》)中科学数据的定义,如果符合就纳入。②将政策按发布时间排序,并从发布最早的政策开始逐个阅读,寻找科学数据定义的源头政策。经阅读发现,2005年8月份发布的《国家科学数据中心建设技术规范》在我国政策中最早对科学数据的含义做出了解释,然而,同年5月份发布的《科学数据共享工程质量管理规范》和8月份发布的《国家科学数据中心建设技术规范》都属于2005年的《国家科学数据共享工程技术标准》,因此,在纳入时把《科学数据共享工程质量管理规范》确定为研究起点。排除标准如下:①非国家层面政策(国家层面政策是指国务院、各部委及其相同等级的国家机构所颁布的政策,不包括部委颁布的部门政策);②征求意见稿、提案、政策解读、答复函、政府报告等;③研究起点时间之前发布的政策;④政策不完整或者无法获取政策文本全文的。最终被纳入符合要求的政策文件106份,如表1所示:
2.2 研究方法
2.2.1 内容分析法
笔者将政策工具分为权威工具、激励工具、能力建设工具、象征及劝诫工具、系统变革工具(见表2);从政策主体视角,对政策发文主体进行统计,梳理出我国国家层面科学数据政策的主体主要有全国人民代表大会、国务院、科技部、发改委、财政部、国家卫健委等;以聂云贝、高飞、夏义堃等的研究为基础,将科学数据生命周期分为数据计划、数据获取、数据处理、数据保存、数据利用5个主要阶段(见表3)[23-25]。
构建三维科学数据政策文本分析框架,分别为政策工具维度、政策主体维度、数据生命周期维度,如图1所示:
2.2.2 政策文本计量法
以纳入的106份国家层面科学数据政策为样本,按照政策发布时间对政策进行升序编号,然后以“政策编号—政策条款—政策条目”进行编码。编码所依据的原则是不可细分原则,即一段话如果是表达同一层意思的即为1个编码,如果能细分成多层意思的,则细分为多个编码,直到不可细分为止[26]。最终得到981条政策工具编码、1 237条政策主体编码、1 110条数据生命周期编码,如表4所示:
(二十五)推进投融资体制改革
建立健全投资审批数据部门间共享机制,推动投资审批权责“一张清单”、审批数据“一体共享”、审批事项“一网通办” 106-8-25 制度体系 国务院 数据利用
上述编码工作由2名研究者独立完成,为保证内容分析的可信度,采用编码者间的一致性系数α=2*C/(n1+n2)对编码信度进行检验,其中C是两位编码人员在编码过程中完全一致的编码数,n1、n2 分别为两位编码人员各自的编码数量。通过计算α=0.87,不同编码者一致性达到 85% 以上,表明信度在可接受范围内[27]。
3 政策总体情况分析/Overall policy analysis
3.1 年度发文量分布
以政策数量变化情况,结合标志性事件与关键性政策颁布为时间节点,将我国科学数据管理政策演进历程划分为3个阶段:①初步探索阶段(2005—2010年)。2005年科技部发布《国家科学数据中心建设技术规范》,首次在国家层面提出科学数据的概念,我国国家层面开始推动科学数据的发展,在这个阶段,政策年度发文数量先减少后增多。②稳定发展阶段(2011—2017年)。2011年,科技部发布《国家“十二五”科学和技术发展规划》,对未来5年我国科技发展和自主创新的战略任务进行部署[28]。在这个阶段,我国科学数据政策数量整体上呈现稳定增多的趋势。③迅猛发展阶段(2018—2022年)。国务院办公厅发布《办法》,在这个阶段,国家对科学数据发展的关注力度持续加大,科学数据相关政策年发文数量突破10,并在经历一次小浮动后爆发式增长。如图2所示:
3.2 热点关键词分析
以《办法》为时间分界线,运用wordcloud2分别绘制词云。《办法》发布之前共有政策47份,政策聚焦点为科技、创新、技术、研究(见图3),主要致力于推动科学技术发展、促进创新能力提升、推动技术进步和提高研究水平。这可能是由于国务院2005年发布《国家中长期科学和技术发展规划纲要(2006—2020年)》,并且于2006年印发实施《国家中长期科学和技术发展规划纲要(2006—2020年)》若干配套政策,强调科技创新在国家发展中的重要性和战略地位,并提出了一系列政策措施来推动科技、创新、技术、研究的发展[29-30]。《办法》发布之后共有政策59份(包括《办法》),政策聚焦点为发展、建设、服务、创新(见图4),主要致力于建设数据基础设施、提供数据服务,以促进数据的创新应用和高质量发展。这可能是由于《办法》中开宗明义“进一步加强和规范科学数据管理,保障科学数据安全,提高开放共享水平,更好支撑国家科技创新、经济社会发展和国家安全”[31]。在此之后,政策更加注重科学数据基础设施和平台的建设、创新能力和服务能力的提高,以及推动高质量发展。此外,国家也是大力建设数据平台以提升服务能力,例如,2019年6月5日,科技部、财政部发布《关于发布国家科技资源共享服务平台优化调整名单的通知》,将原有8个科学数据类国家平台优化调整形成了国家高能物理科学数据中心等20个国家科学数据中心。
总体来看,我国科学数据政策热点从刚开始的注重技术发展和学术研究的进步向注重数据平台建设、数据服务、数据创新应用和推动高质量发展转变。
4 结果分析/Result analysis
以下分别从“政策工具”“政策主体”“数据生命周期”单维度和“政策工具—政策主体”“政策工具—数据生命周期”“政策主体—数据生命周期”二维交互角度进行分析。
4.1 政策文本的单维度分析
4.1.1 X维度:政策工具
我国科学数据政策类型覆盖了法规管制、任务要求、税收优惠、表彰奖励、宣传推广、榜样示范、机构调整、职能转变等19种政策工具,在使用占比和频次上存在很大差异。在981个政策工具分析单元中,法规管制工具使用占比最高为25.4%(249);其次是基础设施建设工具,使用占比为12.3%(121);排在第三位、第四位的分别是科技信息支持工具、任务要求工具,使用占比分别为11.7%(115)、11.1%(109);处于后两位的分别是社会监督工具、消费补贴工具,占比分别为0.2%(2)、0%(0)。从政策类别来看,我国科学数据政策中使用的权威工具最多,使用占比为45.8%(449);其次是能力建设工具,使用占比为29.9%(293);使用最少的是象征及劝诫工具,占比为5.7%(56)。值得注意的是,激励工具中的惩罚批评工具(占比2.2%)即将达到表彰奖励工具(占比0.8%)的3倍(见表5)。
整体来看,我国科学数据政策中对科学数据管制方面的部署比较多,在基础设施建设、科技信息支持、任务要求等方面也做了大量部署工作,但表彰奖励、社会监督的力度还不够,而且也没在国家层面明文支持对科学数据或其科技产品实行消费补贴。
从历年政策工具使用情况来看,国家2005年开始发布科学数据有关政策时,能力建设工具最多,主要致力于提升技术水平和加工数据资源,为科学数据的发展提供最基本的技术支持。但是不久后,权威工具就超过能力建设工具,居于最多;2011—2014年期间,权威工具和能力建设工具的使用数量不差上下;在2015—2022年期间,能力建设工具两次超过权威工具,分别是2015—2016年、2019—2020年,但只是短暂的超越,整体来看,还是权威工具占据主导地位。激励工具、象征及劝诫工具在历年使用中一直处于占比最少的状态(见图5)。以上结果表明,为科学数据的发展创造良好的法规管制环境和提供基本的能力建设支持是国家科学数据政策部署的侧重点。
4.1.2 Y维度:政策主体
以政策解构单元的1 237个政策主体为基数绘制图6。在我国国家层面科学数据政策中,国务院使用的政策工具最多,为28.1%;其次是科技部,使用政策工具的占比为20.2%;排在第三位的是人民代表大会(13.2%);其他主体发布的政策中使用工具的占比远远少于这三大主体,可见我国国家层面科学数据政策主要是由国务院、科技部、人民代表大会进行部署。《办法》第六条明确指出“科学数据管理工作实行国家统筹、各部门与各地区分工负责的体制”。从国家层面政策主体的分布情况来看,我国科学数据管理工作切实做到了国家统筹,这是我国科学数据管理工作的一大优势。
4.1.3 Z维度:数据生命周期
以政策中涉及到的数据生命周期总频数1 110为基数绘制图7。在科学数据国家层面政策中,有关数据生命周期的政策条文数量占比分布比较均匀。数据利用所占比重最多(34.7%);其次是数据计划(20.0%);排在第三位的是数据保存(17.2%);所占比重处于后两位的分别是数据获取(15.3%)和数据处理(12.8%)。从统计数据可以看出,我国科学数据政策注重于数据利用、数据共享的推动以及数据总体规划、建设目标制定和数据安全保存等,对数据汇交获取、数据处理方面的推动相对较少。究其原因可能是,随着全球开放获取运动和数据密集型科研范式的不断发展,科学数据开放共享已成为各国抢占大数据战略高地和保持国家竞争力的核心举措,因此,为最大化发挥科学数据开放共享的优势作用,各国相继颁布针对性政策以保障和规范科学数据的开放共享和利用[32]。
4.2 政策文本的二维交互分析
4.2.1 政策工具和政策主体
对政策文本编码比例大于2%的政策主体进行分析(见表6)。国务院、科技部、人民代表大会、工信部、国家卫健委主要使用的是权威工具,其次是能力建设工具;发改委、财政部、国家能源局主要使用的是能力建设工具,其次是权威工具;国土资源部主要使用的是权威工具,其次是系统变革工具;教育部主要使用的是能力建设工具,其次是系统变革工具。
总体来看,各政策主体对权威工具和能力建设工具的使用最多,对系统变革工具的使用次之,使用最少的是激励工具、象征及劝诫工具。可能的原因是:权威工具和能力建设工具在政策实施方面能够起到明确的指导和支持作用,可提供一种制度性基础,更直接且有效地引导和改善科学数据的管理与使用。相较于权威工具和能力建设工具,系统变革工具需要更多的资源和时间,并且对于政策主体来说可能存在一定的风险,需要更谨慎地考虑和评估。激励工具、象征及劝诫工具虽然在某些情况下具有一定的效果,但相对于权威工具、能力建设工具和系统变革工具来说,其影响力和可操作性较小。
4.2.2 政策工具和数据生命周期
在科学数据整个生命周期中,数据计划阶段使用最多的是任务要求工具。数据获取、数据处理、数据保存和数据利用阶段使用最多的是法规管制工具,见表7。
整体来看,权威工具在整个数据生命周期中使用最多(46.8%),其次是能力建设工具(32.9%)、系统变革工具(12.2%),在数据生命周期中使用较少的是象征及劝诫工具(5.0%),最少的是激励工具(3.1%)。可能原因是:科学数据政策往往依赖于权威机构或组织的指导和规范,因此在整个数据生命周期中,使用权威工具可以提供明确的指导和规则,使数据管理更加规范和可靠。技术、平台、人员的能力和知识是关键因素,在数据生命周期中使用能力建设工具可以提升数据管理的效能和质量,从而降低风险。随着科学研究和数据管理环境的不断变化,在数据生命周期中使用系统变革工具可以帮助科研机构或组织适应新的挑战和需求。象征及劝诫工具更多地侧重于道德和舆论层面的建设,相较于技术和管理规范,其直接性和可控性略有逊色,因此,在数据生命周期中使用象征及劝诫工具相对较少。激励工具需要一定的社会资源和机制来支持,如金融支持、税收优惠、奖励惩罚等,需要统筹社会各方面的力量去协调,因此还在探索阶段。目前,学界关于科学数据利益相关者的探讨和界定,可以为数据生命周期中激励工具的使用提供一定的参考。
4.2.3 政策主体和数据生命周期
由表8可知,国务院的部署在数据计划、数据获取、数据保存、数据利用阶段的占比最多,分别为24.5%、29.3%、28.2%、32.7%。除了数据处理阶段主要由科技部部署(25.8%),数据计划、数据获取、数据保存、数据利用阶段都主要由国务院部署。科技部负责数据处理阶段主要是因为其具备科技资源优势和研发创新能力,而国务院部署其他阶段主要是为了统筹和协调各方资源、促进数据共享与合作、制定统一标准与规范、推动政策和法规的制定和管理。
5 结论与建议/Conclusions and suggestions
5.1 研究结论
笔者运用内容分析法和政策文本计量法,以“政策工具—政策主体—数据生命周期”为三维分析框架,选取2005—2022年间我国国家层面颁布的106 份科学数据政策作为研究样本展开量化分析,得出如下结论:
(1)政策工具维度上表现出明显的倾向性,基本形成“权威工具+能力建设工具”的政策工具分布模式。权威工具可以提供规范和强制力,推动政策的执行和遵守,能力建设工具则能够增强政策实施的能力和效果。以“权威工具+能力建设工具”为主的组合模式可以增强工具的整体效力,提高政策的效果并为可持续发展提供基本动力。系统变革工具远远少于权威工具和能力建设工具,居于第三位,其侧重于“制度体制”子类,辅以“职能转变”和“机构调整”子类,内部结构分配较为合理,为新形势下科学数据发展中解决挑战性、不确定性问题提供支持。
(2)我国国家层面科学数据政策主要是由国务院、科技部、人民代表大会进行部署。人民代表大会是国家最高权力机关,国务院是国家最高行政机构,科技部是国家最高科技管理机构,三大机构作为科学数据的主要政策主体,对科学数据统一规划和管理,体现了国家对科学数据发展的重视,可确保科学数据的采集、存储、共享和利用符合国家的整体需求和战略目标。
(3)政策致力于推动数据共享和利用,同时也在加大基本能力建设的投入。在数据成为生产要素的大背景下,推动数据利用能够实现更高质量的发展和全面进步。我国国家层面的科学数据政策不仅注重推动数据利用,也在加大科学数据发展的基本能力建设,鼓励数据的交易和流通,从而为数据利用和共享提供保障。
5.2 政策建议
通过“政策工具—政策主体—数据生命周期”3个维度的分析,笔者提出我国国家层面科学数据政策的优化建议,具体如下:
(1)适当增加激励工具和象征及劝诫工具的使用占比。权威工具可以提供框架和规则,满足合法性和合规性的要求。能力建设工具能提供适当的基础设施、技术平台、知识和技能,以实际操作和管理科学数据。系统变革工具通过调整机构、转变职能、完善制度体系等方式为科学数据的正向发展提供保障。激励工具可通过社会融资,给予从事科技活动的重要领域或关键技术的企业、个人赋税上的减免和对市场需求端消费者进行补贴来拉动成果转化。象征及劝诫工具可根据国家目标规划有针对性地对科学数据相关政策、知识、研究成果、示范性试点等公开宣传,提高公众对科学数据相关知识的了解,并接受社会监督。因此,要在权威工具的规范下,发挥好能力建设工具和系统变革工具的保障作用,适当运用激励工具、象征及劝诫工具的调节作用,实现协同效应。但是,研究发现,2005—2022年国家层面科学数据政策中激励工具、象征及劝诫工具的使用占比过少。如果激励工具持续过少,会造成社会融资困难、企业及科研人员积极性下降、成果转化市场拉动力不足等问题。如果象征及劝诫工具持续过少,可能会导致公众对科学数据政策及研究认知不足、研究成果的可信度下降等问题,在一定程度上不利于科学数据的长期发展。因此,在制定有关政策时要适当增加激励工具和象征及劝诫工具的使用。
(2)有效优化各类型政策工具内部结构。分析结果显示,在具体政策工具应用方面,我国科学数据政策过于依赖少数政策工具,而且工具内部结构不够均衡。权威工具偏向“法规管制”与“任务要求”子类,“质量评估”占比有待提升;激励工具侧重“金融支持”与“惩罚批评”子类,“税收优惠”和“表彰奖励”占比有待提升。此外,惩罚批评工具占比远远高于表彰奖励工具、“消费补贴”子类工具使用为0的情况需要引起重视;象征及劝诫工具以“榜样示范”为主,“宣传推广”较少,“社会监督”的作用也没有得到很好的运用;能力建设工具偏向“基础设施建设”与“科技信息支持”子类,“资金投入”占比有待提升。针对以上不足,将来在权威工具的使用中,要适当减少“法规管制”与“任务要求”子类,提升“质量评估”的占比,通过对数据质量的把控来间接达到管制的目的;在激励工具的使用中,要增加“税收优惠”“表彰奖励”和“消费补贴”等子类工具,在供给端激发企业和科研人员的研发积极性,在需求端拉动科学数据产品和成果的购买使用;在象征及劝诫工具的使用中,要增加“宣传推广”和“社会监督”子类工具,加强数据政策的宣传推广以及发挥社会监督的广泛作用;在能力建设工具的使用中,适当增加“资金投入”子类工具的占比,为能力建设提供物质和资金保障。
(3)切实简政放权,合理调节政策主体压力。分析发现,国务院、科技部、人民代表大会三大机构在科学数据政策主体中通过政策工具对科学数据政策进行部署的占比最大,是科学数据的主要政策主体。但是,这可能会使其投入精力过多,造成资源紧缺,从而影响他们有效地开展其他方面的工作。此外,高度统一的管理可能会缺乏专业性和灵活性,无法及时跟上快速发展的数据技术和行业需求,使数据政策难以适应新的挑战和变化。下一步,可以在科学数据政策制定过程中有机融入“责权利、放管服”的思想,在国家层面促进各行业各领域出台自己的科学数据管理政策,充分发挥各领域的优势和专业知识,形成科学数据管理的联动和合作,通过优化各领域机构的科学数据管理来实现国家整体的科学数据管理。
(4)加强科学数据全生命周期管理。分析发现,在科学数据生命周期中,政策部署最多的是数据利用阶段,其次是数据计划和数据保存阶段,部署相对较少的是数据获取、数据处理阶段。可见,推动数据利用是我国目前科学数据政策的侧重点,在数据获取、数据处理阶段的部署有进一步加大的空间。下一步要从政策层面继续促进数据汇交、标准化处理,推动科研机构和科研项目的科学数据采集和整理工作,鼓励科研人员将科学数据及时、准确地提交到数据管理机构或平台,持续做好科学数据元数据管理、数据质量管理,加强个人隐私数据处理,保障数据安全。在科学数据管理政策制定过程中注重全生命周期管理,使用与阶段特征和需求相适应的政策工具,逐渐形成覆盖全生命周期的政策体系。
6 结语/ Epilogue
本文通过“政策工具—政策主体—数据生命周期”三维分析框架对我国国家层面出台的106份科学数据政策文本进行量化分析,进而得出研究结论并提出政策建议。不过,本文可能存在以下局限:政策文本的筛选与编码可能存在主观成分,导致在反映政策全貌特征时存在细微偏差。本文侧重于过程分析与结果讨论,注重应用型研究,在理论方面的贡献较为有限。下一步,在本研究的基础上将结合国家层面政策及各省市政策探究政策传播及扩散情况,进一步探索具有中国特色的科学数据政策发展演化的现状及规律。
参考文献/References:
[1] 赵丽梅, 刘雯.基于文献计量的我国科学数据共享研究态势分析[J]. 图书馆研究, 2022, 52(5): 117-128. (ZHAO L M, LIU W. Bibliometric analysis of scientific data sharing in China[J]. Library research, 2002, 52(5): 117-128.)
[2] 周文能, 刘云, 王刚波.国内外科学数据管理与共享政策分析及对国家自然科学基金的启示[J]. 中国科学基金, 2023, 37(1): 150-160. (ZHOU W N, LIU Y, WANG G B. Policy analysis of domestic and foreign scientific data management and sharing and its enlightenment to national natural science foundation of China[J]. Bulletin of National Natural Science Foundation of China, 2019, 37(1): 150-160.)
[3] 中华人民共和国中央人民政府.关于构建数据基础制度更好发挥数据要素作用的意见[EB/OL]. [2023-12-15]. https://www.gov.cn/gongbao/content/2023/content_5736707.htm. ( The State Council of the Peoples Republic of China. Opinions on building a data basic system to better play the role of data elements [EB/OL]. [2023-12-15]. https://www.gov.cn/gongbao/content/2023/content_5736707.htm.)
[4] GABA J F, SIEBERT M, DUPUY A, et al. Funders data-sharing policies in therapeutic research: a survey of commercial and non-commercial funders[J]. PLos one, 2020, 15(8): e0237464.
[5] MARTANI A, EGLI S M, GENEVIEVE L D, et al. A role-model for data policies? qualitative study on the governance of health data in Denmark[J]. Health policy and technology, 2022, 11(4): 100683.
[6] ?TEBE J, DOLINAR M, BEZJAK S, et al. Implementing the RDA research data policy framework in Slovenian scientific journals[J]. Data science journal, 2020, 19(1): 49-49.
[7] WAITHIRA N, MUTINDA B, CHEAH P Y. Data management and sharing policy: the first step towards promoting data sharing[J]. BMC medicine, 2019, 17(1): 1-5.
[8] VAN DER MAREL E, FERRACANE M F. Do data policy restrictions inhibit trade in services?[J]. Review of world economics, 2021, 157(4): 727-776.
[9] ROUSI A M, LAAKSO M. Journal research data sharing policies: a study of highly-cited journals in neuroscience, physics, and operations research[J]. Scientometrics, 2020, 124:131-152.
[10] 马合, 黄小平.欧美科学数据政策概览及启示[J]. 图书与情报, 2021, 200(4): 84-91. (MA H, HUANG X P. Overview of American and European policies about scientific data and the enlightenment to our country[J]. Library & information, 2021, 200(4): 84-91.)
[11] 张红亮.英国科学数据管理政策研究[J]. 医学信息学杂志, 2020, 41(7): 19-24. (ZHANG H L. Study on UK scientifie data management policy[J]. Journal of medical informatics, 2019, 41(7): 19-24.)
[12] 王芳, 卜昊昊.科学数据管理政策发展比较研究[J]. 中国图书馆学报, 2022, 48(6): 77-96. (WANG F, BU H H. A comparative study on policy development for scientific data management[J]. Journal of library science in China, 2022, 48(6): 77-96.)
[13] 王颢燃. 中英科研数据管理政策比较研究[D]. 大连: 辽宁师范大学, 2021. (WANG H R. A comparative study of research data management policies between China and Britain [D]. Dalian: Liaoning Normal University, 2021.)
[14] 姜鑫, 王德庄.利益相关者视域下科学数据开放政策协同研究——基于NVivo 12的质性文本分析[J]. 情报理论与实践, 2022, 45(12): 92-102. (JIANG X, WANG D Z. Research on policy synergy of open research data policy from the perspective of stakeholders: a qualitative text analysis based on NVivo 12 [J]. Information studies: theory & application, 2002, 45(12): 92-102.)
[15] 郭仕琳. 政策视角下科学数据开放共享的利益平衡机制研究[D]. 哈尔滨: 黑龙江大学, 2018. (GUO S L. Research on interest balance mechanism of scientific data opening and sharing from the policy perspective[D]. Harbin: Heilongjiang University, 2018.)
[16] 宋永辉, 姜鑫, 马廷灿.科学数据政策研究的热点及演化趋势分析[J]. 科学观察, 2021, 16(6): 16-29. (SONG Y H, JIANG X, MA T C. Analysis on hot spots and evolution trend of scientific data policy research[J]. Science focus, 2019, 16(6): 16-29.)
[17] 司莉, 刘莉.我国科学数据管理政策:内容结构及优化策略——基于政策文本内容的量化分析[J]. 情报理论与实践, 2023, 46(9): 16-23. (SI L, LIU L. Scientific data management policy in China: content structure and optimization strategies: a quantitative analysis based on the content of policy text[J]. Information studies: theory & application, 2019, 46(9): 16-23.)
[18] 霍倩, 梁宵萌, 潘亚男.科学数据管理政策对档案部门科学数据管理的启示——基于政策工具的文本量化分析[J]. 图书情报工作, 2021, 65(20): 23-30. (HUO Q, LIANG X M, PAN Y N. The enlightenment of scientific data management policy to scientific data management in archives departments——textual quantitative analysis based on policy tools[J]. Library and information service, 2011, 65(20): 23-30.)
[19] MCDONNELL L M, ELMORE R F. Getting the job done: alternative policy instrument[J]. Educational evaluation and policy analysis, 1987, 9(2): 133-152.
[20] SCHNEIDER A, INGRAM H. Behavioral assumptions of policy tools[J]. The journal of politics, 1990, 52(2): 510-529.
[21] 中国科技资源共享网. 国家相关政策文件[EB/OL]. [2023-12-15]. https://escience.org.cn/data-archive/policy. (China Science and Technology Resource Sharing Network. Relevant national policy documents[EB/OL]. [2023-12-15]. https://escience.org.cn/data-archive/policy.)
[22] 中华人民共和国科学技术部.关于发布国家科技资源共享服务平台优化调整名单的通知[EB/OL]. [2023-12-15]. https://www.most.gov.cn/xxgk/xinxifenlei/fdzdgknr/qtwj/qtwj2019/201906/t20190610_147031.html. (Ministry of Science and Technology of the Peoples Republic of China. Notice on releasing the list of optimization and adjustment of the national science and technology resource sharing service platform [EB/OL]. [2023-12-15]. https://www.most.gov.cn/xxgk/xinxifenlei/fdzdgknr/qtwj/qtwj2019/201906/t20190610_147031.html.)
[23] 聂云贝, 刘桂锋, 刘琼.数据生态链视角下科学数据生命周期运行过程分析[J]. 信息资源管理学报, 2021, 11(2): 69-77. ( NIE Y B, LIU G F, LIU Q. Analysis of the running process of scientific data lifecycle from the perspective of data ecology chain[J]. Journal of information resources management, 2021, 11(2): 69-77.)
[24] 高飞, 周国民, 满芮.基于生命周期理论的农业科学数据中心化管理模式[J]. 大数据, 2022, 8(1): 24-36. (GAO F, ZHOU G M, MAN R. Centralization of agricultural scientific data management model based on lifecycle theory[J]. Big data research, 2022, 8(1): 24-36.)
[25] 夏义堃, 管茜.基于生命周期的生命科学数据质量控制体系研究[J]. 图书与情报, 2021(3): 23-34. (XIA Y K, GUAN X. Biological science data quality control system based on lifecycle[J]. Library & information, 2021(3): 23-34.)
[26] 汪雯, 张飞飞, 李红勋.政策工具视角下重点生态功能区促进农村劳动力就业政策的文本量化研究[J]. 北京林业大学学报(社会科学版), 2023, 22(3): 50-63. (WANG W, ZHANG F F, LI H X. Text quantitative analysis of the employment promotion policies of rural labor force in key ecological function areas from the perspective of policy instruments[J]. Journal of Beijing Forestry University (social sciences), 2023, 22(3): 50-63.)
[27] VINEY L L. The assessment of psychological states through content analysis of verbal communications[J]. Psychological bulletin, 1983, 94(3): 542-563.
[28] 中华人民共和国科学技术部.关于印发国家十二五科学和技术发展规划的通知[EB/OL]. [2023-12-15]. https://www.most.gov.cn/xxgk/xinxifenlei/fdzdgknr/qtwj/qtwj2011/201107/t20110713_88228.html. (Ministry of Science and Technology of the Peoples Republic of China. Notice on the issuance of the national twelfth five-year plan for science and technology development[EB/OL]. [2023-12-15]. https://www.most.gov.cn/xxgk/xinxifenlei/fdzdgknr/qtwj/qtwj2011/201107/t20110713_88228.html.)
[29] 中华人民共和国中央人民政府.《国家中长期科学和技术发展规划纲要(2006—2020年)》[EB/OL]. [2023-12-15]. https://www.gov.cn/gongbao/content/2006/content_240244.htm. ( The State Council of the Peoples Republic of China. Outline of the national program for medium - and long-term scientific and technological development (2006-2020) [EB/OL]. [2023-12-15]. https://www.gov.cn/gongbao/content/2006/content_240246.htm.)
[30] 中华人民共和国中央人民政府.国务院关于印发实施《国家中长期科学和技术发展规划纲要(2006—2020年)》若干配套政策的通知[EB/OL]. [2023-12-15]. https://www.gov.cn/gongbao/content/2006/content_240246.htm. ( The State Council of the Peoples Republic of China. Notice of the State Council on printing and distributing several supporting policies for the implementation of the outline of the national program for medium - and long-term scientific and technological development (2006-2020)[EB/OL]. [2023-12-15]. https://www.gov.cn/gongbao/content/2006/content_240246.htm.)
[31] 中华人民共和国中央人民政府.国务院办公厅关于印发《科学数据管理办法》的通知[EB/OL]. [2023-12-15]. http://www.gov.cn/zhengce/content/2018-04/02/content_5279272.htm?cid=303. (The State Council of the Peoples Republic of China. Notice of the General Office of the State Council on printing and distributing the measures for the management of scientific data [EB/OL]. [2023-12-15]. http://www.gov.cn/zhengce/content/2018-04/02/content_5279272.htm?cid=303.)
[32] 范昊, 郑小川, 热孜亚·艾海提.我国科研数据开放共享政策供需匹配研究[J]. 信息资源管理学报, 2023, 13(6): 156-165. (FAN H, ZHENG X C, AIHAITI R. Research on the match between Chinese research data open sharing policy supply and user demand[J]. Journal of information resources management, 2023, 13(6): 156-165.)
作者贡献说明/Author contributions:
王流芳:方案设计,计量分析,论文撰写与修改;
荣注瑶:计量分析;
贾晓峰:研究选题,研究框架提出,论文修改;
胡志民:研究选题,研究框架提出,论文修改。
The Text Content Analysis of Chinese Scientific Data Policy Based on Three-Dimensional Framework
Wang Liufang1 Rong Zhuyao1 Jia Xiaofeng2 Hu Zhimin1
1School of Health Policy and Management, Chinese Academy of Medical Sciences & Peking Union Medical College, Beijing 100730
2China National Health Development Research Center, Beijing 100044
Abstract: [Purpose/Significance] This paper analyzes the scientific data policy texts released at the national level in China and describes the characteristics of national policy deployment, intending to better grasp the development trend of scientific data policy and providing important references for the formulation of scientific data related policies in China. [Method/Process] Based on the three-dimensional analysis framework of “policy tool - policy subject - data lifecycle” (i.e., X dimension, Y dimension, and Z dimension), the content analysis method and policy text measurement method were used to deconstruct and quantify 106 scientific data policies published at the national level from 2005 to 2022 in China. [Result/Conclusion] The distribution pattern of “authority policy tools + capacity policy building tools” is formed. The State Council, the Ministry of Science and Technology, and the Peoples Congress, as the main subjects of scientific data policy, are making unified planning and management of scientific data. The scientific data policy aims to promote the use and sharing of data while increasing investment in basic capacity building for scientific data development. Notably, the absence of incentive tools, symbols, and exhortation tools is serious, and the internal structure of policy tools is not balanced. The State Council, the Ministry of Science and Technology, and the Peoples Congress bear a heavy burden in scientific data management. The current policy has less deployment for the data acquisition and data processing stage. Proposals are given to increase the proportion of incentive tools and symbolic and exhorting tools, optimize the internal structure of various types of policy tools, effectively streamline administration and delegate power, rationally adjust the pressure of policy subjects, and strengthen the management of the whole lifecycle of scientific data.
Keywords: scientific data policy text three-dimensional framework content analysis
Fund project(s): This work is supported by the CAMS Innovation Fund for Medical Sciences “Construction of Technology System for Intelligent Management and Efficient Utilization of Big Data in Population and Health Science” (Grant No. 2021-I2M-1-057).
Author(s): Wang Liufang, master candidate; Rong Zhuyao, master candidate; Jia Xiaofeng, associate researcher, PhD; Hu Zhimin, researcher, PhD, corresponding author, E-mail:huzhimin@pumc.edu.cn.
Received: 2023-12-05 Published: 2024-04-23