APP下载

高校学生科研数据需求管理的影响因素探究

2020-10-20胡媛王倩妮

现代情报 2020年10期
关键词:高校学生影响因素

胡媛 王倩妮

摘  要:[目的/意义]在第四研究范式下,大数据时代的来临使得高校学生的科研数据需求日益旺盛,深入探究影响科研数据需求管理的关键因素组合,便于引导高校学生对科研数据需求进行管理,促使各环节下衍生出的数据需求规范化。[方法/过程]本文采用fsQCA方法对问卷数据进行处理,分析了技术、服务、情境、用户因素在何种组合下,能够促进科研数据需求管理的发生。[结果/结论]研究结果揭示了引致高校学生进行科研数据需求管理的3组构型,其中用户因素在科研数据需求管理工作中最为关键。最后针对得到的条件组合提出相应建议,为落实科研数据需求管理相关工作提供启示。

关键词:高校学生;科研数据;fsQCA;数据需求管理;影响因素

DOI:10.3969/j.issn.1008-0821.2020.10.011

〔中图分类号〕G25076  〔文献标识码〕A  〔文章编号〕1008-0821(2020)10-0104-09

Research on the Influencing Factors of Scientific Data

Demand Management of University Student

——Based on fsQCA Method

Hu Yuan  Wang Qianni

(School of Management,Nanchang University,Nanchang 330031,China)

Abstract:[Purpose/Significance]Under the fourth research paradigm,the advent of the era of big data makes the demand for scientific research data of college students increasingly vigorous.In-depth exploration of the key factors influencing the requirement for the data demand management can help guide college students to manage the demand of scientific research data and promote the standardization of data demand derived from each link.[Method/Process]In this paper,fsQCA method was adopted to process the questionnaire data.The combination of technology,service,context and user factors was analyzed to promote the occurrence of scientific research data demand management.[Result/Conclusion]The research results revealled three configurations that affected college students scientific research data demand management,among which the user factor was the most critical.Finally,corresponding Suggestions were put forward according to the obtained conditional configurations to provide enlightenment for the implementation of scientific research data demand management.

Key words:university student;scientific data;fsQCA;data demand management;influencing factors

在數据密集型科学研究范式的主导下[1],科研数据作为一种重要的学术资源,对高校学生从事日常学术活动的影响与日递增。研究者在进行研究任务的各环节中不可避免地产生科研数据需求,并引发后续的数据搜寻、利用、共享等数据行为[2]。就目前的科研数据利用现状来看,仍然存在科研数据资源冗余[3]、数据利用效率较低[4]、科研人员数据素养水平有限[5]等问题,导致高校学生的科研数据需求无法得到有效满足。同时,高校学生尤其是硕、博士生,作为科学研究工作的重要参与主体,对其数据需求的管理尤为重要。

现有研究对于科研数据需求管理的探讨较为有限,最为常见的是围绕数据本身探讨数据管理[6]、数据服务[7]、数据共享[8]等概念,力求从加强数据管理角度达成科研数据的增值,而往往忽略了数据需求这一根本性问题。要提高科研效率,维持科研数据的活力,必须引导高校学生根据实际情况调整自身数据需求,保证各阶段各情境下的科研数据需求的有效性,使需求与研究目标精准匹配。与此同时,高校学生的科研数据需求管理受到多重因素作用,并非仅受个别因素的影响。因此,筛选出能够触发高校学生进行数据需求管理的关键因素,针对性地解决数据需求所衍生出的相关问题,促进高校科研工作高效开展和科研创新,是一个值得研究的重要科学问题。

因此,本文立足于高校学生的科研数据需求管理视角,通过定性比较分析方法,综合分析影响数据需求管理的关键因素组合,找寻优化科研数据需求的最佳路径,从而有效解决科研过程中出现的数据需求冗余、协调性差等问题。

本文使用fsQCA方法来检验技术、服务、情境、用户4个解释维度之间的关系以及它们如何共同影响科研数据需求管理过程。QCA的优势在于能通过样本间的充分比较和分析,提炼出多因素联合影响既定对象的最佳组合形式。选定fsQCA展开后续研究,主要基于以下几点考虑:1)传统的数据分析方法聚焦于探讨单变量对特定对象的影响程度和路径,而fsQCA则可以有效处理多种因素的组合对结果的交互效应[24]。2)虽然多因素分析、聚类分析等方法也可以进行组态关系的研究,但并不能同fsQCA这样去识别多种因素之间的依赖关系,产生随机组合。3)fsQCA面向连续性变量,能够准确量化界限模糊的条件因素。考虑到本研究中的影响因素存在中间状态,因而选择fsQCA方法对数据进行处理。

32  量表设计

本实证研究基于先前理论研究展开,依据研究量表和相关参考文献设计问卷。问卷采用李克特五点式量表进行调查,5表示“非常赞同”、3表示“中立”、1表示“非常不赞同”。其中1~3题项设置为统计参与调查人员的基本信息,第4~27题项为问卷主体部分,主要围绕技术、服务、情境、用户4个维度对科研数据需求管理的影响进行测量。最后一部分28~31题用来评定科研数据需求管理这一结果变量。

本研究将高校学生作为科研主体对象,主要由以下原因决定:一是在科研过程中,硕、博士生等高校学生为主要的科研参与者,涉及到实际性数据操作时,往往学生是第一手实施者;二是在提倡本科生创新创业教育背景下,本科生积极参与科研活动已是大势所趋。为确保问卷题项是合理有效的,在发放问卷之前对相关科研工作者展开预调研,并对问卷内容进行了初步调整。

33  数据收集

问卷自2019年5月份发放到8月份回收,期间通过线上调查的方式收集到200份数据样本,其中剔除掉35份填写时间过短和题项答案重复率过高的无效样本,有效样本为165份。数据调研对象为长期从事科研活动的博、硕士研究生以及部分参与科学研究、拥有科研项目经历的本科生。数据来源于多个省市地域和不同学科的高校学生,保证了样本数据的随机性,将研究样本的人口统计学信息展示如表2所示。

4  数据处理与分析

41  信效度检验

在进行定性比较分析步骤前,要先对问卷数据进行信度和效度检验。对问卷进行信度检验的目的是验证各测量题项对于同一维度因子的内部一致性,一般用Cronbachs α系数、组合信度值(CR)和平均萃取平方差值(AVE)来表示问卷信度的高低。效度分析是对问卷总体的有效性进行观察,分析理论上的构念结构是否与得到的测量结果相对应。效度越高意味着測量结果越接近预期达到的目标,通常可以通过内容效度和结构效度来观察问卷的总体效度。

411  信度检验

本文采用Cronbachs α系数来测量问卷信度,其中Cronbachs α系数大于07为可接受的临界值,大于09视为信度很好,系数越趋近于1表明问卷设置越可靠。本文使用SPSS220分析样本得到各分量表和总量表的Cronbachs α系数如表3所示,结果显示,各维度因子的Cronbachs α系数均大于07,处于可接受范围。

412  效度分析

在正式发放问卷前已参考相关科研人员意见进行修改,故问卷的内容效度达到要求,采用因子分析法检验问卷的结构效度。同样在SPSS220中对数据进行分析,表4结果显示:KMO值为0840大于07,Bartlett球体检验显著性水平为0000小于005,因此适合做因子分析。通过对问卷进行探索性因子分析,运行结果表明大部分指标在各因子上的负荷大于05,个别指标低于05及在2个因子以上的负荷值均大于05,应视为问卷的无效项剔除,最终保留表5中16个题项作为测量指标。从表5可以看到,总体上各变量之间区别效度较高,对应相同变量的不同题项之间也呈现出较好的聚合效度。

42  变量校准及编码

在进行组态分析之前,需要对问卷数据进行校准操作,以便将样本数据归为不同的集合隶属。本研究在设计测量问卷时选用了李克特五点量表,必须相应地转换成0~1之间的隶属刻度[25]。我们首先计算题项T1、T2、T3的均值作为技术变量的原始数据,同理得到服务、情境、用户、科研数据需求管理各变量的原始数据。再通过fsQCA30软件对整合后的数据进行Calibrate校准处理,校准依据应结合理论知识和实际情况而定。本文借鉴Ragin C C[26]构建的3个校准临界值:完全隶属值(095),最大模糊值(05),完全不隶属(005),运用Calilibrate程序处理原始值后得到最终变量校准结果(见表6)。由于样本量较大,因此只展示部分样本校准后的数据。

5  结果分析

51  单变量必要性分析

对单项条件变量分别进行必要性检验,一致性不低于09的条件变量为必要条件[27],运行fsQCA30进行变量的必要性分析。如表7所示,只有用户因素的一致性高于09,成为影响科研数据需求管理的必要条件,其余条件的一致性都低于09,不构成必要条件。

52  构建真值集

对数据进行组合和构型分析,在fsQCA30软件中析出真值表集合,应共获得2k种因果组合(k为条件变量个数)。根据Ragin的研究方案,将一致性阈值设定为08,案例阈值设置为3(使保留的有效案例不低于75%),满足阈值的条件组合所构成的真值表如表8所示。表中组态指出了样本中前因条件相互组合引致多重并发现象的可行路径,能够说明何种组合下最有可能激发高校学生数据需求管理的意愿。fsQCA 30软件可得出复杂解、简单解、中间解3种析出结果,中间解能够较好地平衡理论与实际事实的出入,因此本研究选定中间解作为研究结果。本文采用Fiss P C的结果呈现形式[24],●代表核心条件存在,●代表边缘条件存在,空白表示该条件出现或缺乏均可,表9处理结果中未出现所代表的核心条件缺失和所代表的边缘条件缺失。

从表9中可以看出,有3种条件组合满足要求,分别是技术*服务*用户、技术*情境*用户和服务*情境*用户,对案例的总体覆盖度达到8526%。其中,组态3的一致性最高,这意味着该条件组合是导致科研数据需求管理行为发生的最优路径。具体结果分析如下:

1)组态1指出,促进高校学生数据需求管理的主要条件为技术、服务和用户3种因素的组合。技术、服务因素贯穿在一系列的科研数据操作环节中,作为外界驱动条件会间接影响到科研主体数據需求的变化,而用户因素则是从内部最根本地改变高校学生对自身数据需求的认知。内外共同作用之下,会极大推动高校学生对科研任务中的数据需求进行适配性调整。

2)组态2说明了外部技术因素和人员从事科研活动所处的情境以及人员自身因素都会致使高校学生对数据需求进行管理,这是由科研数据需求的动态特征和个性化分布所决定的。首先,高校学生执行科研任务过程中不断衍生出新的数据需求,必须依托于技术手段来满足。高校学生的数据需求能否与技术工具完美地匹配,决定了科研数据需求的有效性。相应地,高校学生因自身知识构造、感知能力不同,在不同情境下作出的需求反馈也各有所异。由此这3个维度构成的组态成为影响高校学生管理自身数据需求的主要路径之一。

3)组态3表示在高校学生完成科研任务过程中,服务因素连同情境因素和用户自身属性最为显著地影响了自身的数据需求管理意愿。服务是高校学生实现数据需求转化为行为的重要支撑,情境致使高校学生的数据需求发生动态变化。此外,数据需求产生和改变时,高校学生的内部知识体系、感知能力等用户属性起到支配作用。科研主体为满足因研究任务产生的数据需求时,利用各项个性化服务和知识服务对庞大复杂的数据资源进行筛选组织,并会根据应用情境整合为对自身而言利用价值高的数据集。因此,服务、情境和用户因素也是导致高校学生进行数据需求管理的强有力条件集。并且从一致性大小可以看出,组态3是导致高校学生调整各阶段科研数据需求的最优组合。

4)3种构型中均包含了用户因素,说明用户自身属性对高校学生数据需求管理的影响较为关键,验证了它作为核心条件的存在。用户因素之所以如此显著地影响到高校学生对数据需求的管理意愿和强度,主要与高校学生的数据需求受到用户感知的调节和个人特质的影响有关。从用户感知层面上看,用户通过各种平台数据库搜寻和利用科研数据,期间产生有用性、易用性和满意度的认知,而认知结果决定了用户对数据的认可和利用程度,最终影响到用户的实际需要。从个人特质层面上,高校学生具有学科特性,不仅拥有不同的专业知识和数据素养,个人所产生的自我效能感也有所差异。这些用户属性因素直接映射到具体研究任务中科研主体所产生的数据需求,决定了高校学生对数据的需求内容以及需求强度。

6  结果分析与建议

在科研活动中数据需求的产生和迭代不可避免,要从根本上保证科研数据需求有效转化为数据行为,必须从多角度捕捉科研数据需求管理的关键动因,从而聚焦到科研数据需求管理工作之中的重点,才能提升科研数据在学术研究中的价值。

本文借助fsQCA这一方法揭示出影响高校学生科研数据需求管理的关键路径,分别为:1)技术、服务、用户;2)技术、情境、用户;3)服务、情境、用户。研究结果表明。用户因素涵括在引致结果发生的3种主要的条件组合中,成为驱动高校学生进行数据需求管理的核心条件,该研究结果与先前理论研究结论存在一致性,对用户维度是科研数据需求管理的关键影响因素这一研究结论起到验证作用。用户因素显著影响高校学生的数据需求产生以及阶段性变化,用户个人特质和用户感知使得高校学生的数据需求呈个性化分布,各科研主体之间因学科背景、感知能力等存在差异,产生的数据需求并不相同,随外界条件的改变对科研数据需求所作出的调整也大为不同。而情境因素主要作为外部刺激引起数据需求的变化或驱动需求的产生,其中任务情境和移动信息情境是科研活动的主要情境属性,主要由高校学生团队协作情况、科研活动涉及的学科领域、数据资源的表现形式等要素构成,高校学生的数据需求与各情境要素密切相关。技术因素和服务因素为数据需求管理提供外部支撑,作为科研数据需求管理活动中的工具与手段,主要发挥辅助性作用。因此,它们对科研数据需求管理的影响效果不如用户因素显著。最后,针对得到的构型组态,本研究提出以下建议:

1)重点关注高校学生的属性特征,拓宽科研数据的应用范围。科研数据需求管理的目标是使科研数据创造出更大的价值,必须深入挖掘高校学生的数据需求,识别并激发出数据需求方的深层需求,加强数据资源的可重用性。同时,通过对高校学生的学科属性、知识结构和感知能力等展开跟踪,形成数据需求层面的用户画像,不仅能够规范化单个科研主体的数据需求,还可映射到协同群体之中,使得科研数据需求管理工作更加高效化。

2)通过相关技术手段加强对高校学生的数据需求动态变化的掌握。科研主体的数据需求管理活动扎根于科研情境之中,根据不同的情境要素,如科研任务的履行难度及紧迫性、数据资源的属性和呈现形式不同,科研主体随之衍生出的数据需求存在差异。将情景感知技术、协同算法等引入到数据需求管理工作中,能够多维度多方位地识别不同阶段下科研主体的数据需求,帮助科研主体及时、全面、精准地进行弹性调整,最大限度地满足高校学生各研究环节下对数据的需要。

3)服务提供商应提供嵌入式服务与科学的技术工具,服务与技术应嵌入用户知识环境,提供商应参与用户知识创新的过程之中。可通过构建大数据资源体联盟,建立起全面完善的元数据资源库,为用户提供集组织、查询、储存、共享等功能于一体的服务机制。通过技术和服务等手段的干预,引导科研用户及时调整数据需求,使得高校学生所获取的数据都被有效利用,发生有助于科研活动的数据行为。

参考文献

[1]Hey T.The Fourth Paradigm-Data-Intensive Scientific Discovery[M].E-Science and Information Management.Springer Berlin Heidelberg,2012.

[2]洪程,钱鹏.高校研究生科学数据需求与利用行为调查分析——以东南大学为例[J].国家图书馆学刊,2014,23(1):16-21.

[3]王翠萍,李佳潞.国外高校图书馆科学数据服务现状与启示——以五所高校图书馆为例[J].图书馆工作与研究,2017,(10):31-36.

[4]孟祥保,常娥,叶兰.数据素养研究:源起、现状与展望[J].中国图书馆学报,2016,42(2):109-126.

[5]沈婷婷.数据素养及其对科学数据管理的影响[J].图书馆论坛,2015,35(1):68-73.

[6]魏悅,刘桂锋.基于数据生命周期的国外高校科学数据管理与共享政策分析[J].情报杂志,2017,36(5):153-158

[7]迟玉琢,王延飞.国外高校科研数据服务需求识别模型特点与启示[J].图书情报工作,2016,60(4):37-43.

[8]Si L,Xing W,Zhuang X,et al.Investigation and Analysis of Research Data Services in University Libraries[J].The Electronic Library,2015,33(3):417-449.

[9]胡媛,艾文华.工程化视角下的科研数据需求管理模型构建[J].情报杂志,2019,38(3):187-193.

[10]Gregory K,Groth P,Cousijn H,et al.Searching Data:A Review of Observational Data Retrieval Practices[J].2017.

[11]Tenopir C,Sandusky R J,Allard S,et al.Research Data Management Services in Academic Research Libraries and Perceptions of Librarians[J].Library & Information Science Research,2014,36(2):84-90.

[12]Gao J,Yang H.Information Search Model Based on Ontology and Context Aware Technologies[M].Information Computing and Applications.Springer Berlin Heidelberg,2010.

[13]Eltabakh M Y,Aref W G,Elmagarmid A K.A Database Server for Next-generation Scientific Data Management[C]//IEEE International Conference on Data Engineering Workshops.IEEE,2010.

[14]徐永丽,李秀英.网络环境中用户信息需求障碍分析[J].图书馆理论与实践,2004,(6):24-25.

[15]宋雪雁,王萍.信息采纳行为概念及影响因素研究[J].情报科学,2010,28(5):760-762,767.

[16]张晋朝.高校科研人员科学数据获取意愿研究[J].情报杂志,2013,32(6):70-75,106.

[17]Katriina Bystrm,Murtonen K,Kalervo Jrvelin,et al.Task Complexity Affects Information Seeking and Use[J].Information Processing & Management,1995,31(2):191-213.

[18]Si L,Xing W,Zhuang X,et al.Investigation and Analysis of Research Data Services in University Libraries[J].The Electronic Library,2015,33(3):417-449.

[19]Tenopir C,Sandusky R J,Allard S,et al.Research Data Management Services in Academic Research Libraries and Perceptions of Librarians[J].Library & Information Science Research,2014,36(2):84-90.

[20]Kim,Youngseek.Fostering Scientists Data Sharing Behaviors Via Data Repositories,Journal Supplements,and Personal Communication Methods[J].Information Processing & Management,2017,53(4):871-885.

[21]胡媛,艾文华,胡子祎,等.高校科研人员数据需求管理影响因素框架研究[J].中国图书馆学报,2019,45(4):104-121.

[22]Longest K C,Vaisey S.Fuzzy:A Program for Performing Qualitative Comparative Analyses(QCA)in Stata[J].The Stata Journal,2008,8(1):79-104.

[23]邓胜利,付少雄.定性比较分析(QCA)在图书情报学中的应用——以网络社区健康信息搜寻影响因素研究为例[J].情报理论与实践,2017,40(12):23-28,11.

[24]Fiss P C.A Set-Theoretic Approach to Organizational Configurations[J].The Academy of Management Review,2007,32(4):1180-1198.

[25]Mendel J M,Korjani M M.Theoretical Aspects of Fuzzy Set Qualitative Comparative Analysis(fsQCA)[J].Information Sciences,2013,237(Complete):137-161.

[26]Ragin C C.Set Relations in Social Research:Evaluating Their Consistency and Coverage[J].Political Analysis,2006,14(3):291-310.

[27]Skaaning S E.Assessing the Robustness of Crisp-set and Fuzzy-set QCA Results[J].Sociological Methods & Research,2011,40(2):391-408.

(责任编辑:孙国雷)

猜你喜欢

高校学生影响因素
高校学生意外伤害事件应对与处理
高校学生网上评教的探索与实践
关于高校学生工作的思考
高校学生管理工作初探