对图书馆学问卷调查法论文的统计分析*
2019-01-17宋红霞
周 黎,宋红霞
0 引言
问卷是指将所要调查的内容,具体化为一系列有机联系的可测指标,以便进行定量测量的方法[1]。问卷调查法由英国高尔顿创立,是指研究者依照标准化的程序,把设计的问卷分发或邮寄给有关人员,然后回收问卷,并对问卷结果进行整理和统计分析,从而得出研究结果的量化研究方法。问卷调查法具有经济省时、保密度高、调查范围广等优点[2],被广泛应用于社会学、政治学、营销学等社科领域。我国图书馆学界引入问卷调查法的时间较晚。1984年调查法研究文章在20篇左右,占比仅为3.1%[3]。随着实证研究逐渐得到重视,问卷调查法论文增多,2012-2015年达到井喷状态[4],但存在不科学、不规范现象。近年图情领域诸多学者关注这一问题,徐建华团队的研究最为系统和完整。该团队2013年起对使用问卷调查法的文章逐年分析,形成年度分析报告。本文在这些年度分析报告的基础上进行再分析,以更好地了解发展趋势、发现问题。
1 文献回顾
1928年,美国芝加哥学派开创图书馆学实证研究范式,它基于图书馆学的外部视角,选择与社会密切相关的研究课题,采用内容分析、田野调查、调查统计等实证研究方法,对图书馆学的问题进行量化分析[5]。而在1972年之前的近50年里,图书馆学学术论文使用的研究方法不断变化。Järvelin等对1965-1985年有关图情学论文的研究发现调查方法位居第二[6]。Hider等对2005年发表在LIS期刊上的实证研究论文进行内容分析,并与1975年和1985年得出的早期结果进行比较,发现调查方法在LIS领域仍占主导地位[7]。我国图书馆学实证研究始于20世纪二三十年代,但70年代末随着芝加哥学派思想传入,实证研究才有所发展但存在许多不足。石烈娟调查1995-2009年间发表的图书馆学实证研究论文,得出样本选取缺乏代表性、实证方法运用单一、研究结论过于空泛等结论[8]。赵安对2003-2012年图书馆学实证研究期刊论文进行分析,发现存在数量少、水平低、理论框架不明、缺乏系统训练等问题[9]。
我国以往关注实证研究的文章,大部分以思辨感悟为主。李超平从学科建构角度提出实证方法与思辨方法的互补意义,认为应将二者结合起来使用[10]。邱五芳从学科发展的角度,认为长期忽视实证研究导致我国图书馆学的现实基础过于薄弱,应在沿用思辨研究的同时,弘扬实证研究[11]。还有一些研究使用文献计量方法,但查全率较低,无法遍历所有实证研究论文。杨迪在硕士学位论文中对发表在2000-2015年间的图书馆学实证研究期刊文章进行作者、年代、主题、被引等方面的计量分析[12];邱均平等基于相关文献,通过词频分析、共词分析、多元统计分析总结出1999-2008年我国图书馆学研究热点、结构、动态和发展趋势[13];但都存在因所选数据库CNKI文章收录不全导致结论缺乏准确性的可能。
徐建华团队对图书馆学实证研究的关注始于2009年,中断几年后,2013年重新开始。2009年对2004-2008年发表在12种图书馆学核心期刊上的实证研究论文进行分析,发现实证研究文章数量稳定增长、研究主题广泛等特点,存在抽样和数理统计方法使用欠规范等不足[14]。2013年选取11种CSSCI图书馆学来源期刊中的问卷调查法文章进行总体分析,对问卷与量表、研究对象与研究主题进行对比分析,得出研究主题空洞缺少创新、问卷编制主观性、随意性强等结论[15]。2014年对同种期刊的问卷调查法文章进行整体分析,发现存在研究主题集中、调查范围小和忽略抽样方法等问题[16]。2015年对信效度检验的缺失率高、数据分析方法单一等现象进行讨论[17]。2016年着眼于规范写作,提出规范论文应具备的要求[18]。
2 研究方法
为梳理图书馆学实证研究现状,本文将研究范围聚集在问卷调查法——这一实证研究中运用最普遍的方法。徐建华教授团队的相关研究中,由于2009年、2013年被统计期刊与后续几年并不完全一样,而本文又是在年度分析报告的基础上进行的再分析,因此,为保证分析的准确性,仅选取和利用2014-2016年的年度分析报告,即11种被CSSCI收录的核心期刊中主要采用问卷调查法的文章的相关信息,进行对比分析。
在描述性统计与方法分析部分,由于是否提及使用预测试等数值是无序分类变量,无法使用参数统计的方法进行计算。为此,本研究使用卡方检验的方法对三年的数据合并进行推断性统计,判断三年间图书馆学研究在方法使用规范性方面是否存在变化。研究使用SPSS20.0对三年的数据进行合并和卡方检验,由于功能所限,后使用R3.4.4进行两两比较分析,以进一步判断组间差异。
3 研究结果
3.1 各刊文章发表情况分析
2014-2016年11种期刊发表的使用问卷调查法文章的数量及占比(某一期刊所发表的问卷调查法文章的数量占所发表文章总数的比例)见表1。从问卷调查法文章数量看,《图书情报工作》连续三年最多,累计117篇。从问卷调查法文章占比看,《图书情报知识》历年来最高,且呈上升趋势。综合看,运用问卷调查法的文章在期刊发文总量中的比例逐年增加,但均未高于10%,表明图书馆学界虽然重视问卷调查法,但使用率依然不高。
表1 2014-2016年11种图书馆学来源期刊问卷调查法文章的数量及比例
3.2 被调查群体分析
调查对象的选择与研究目标密切相关。一般情况下,研究目标不同,选择的调查对象也会有所差异。在近年对图书馆学期刊问卷调查法文章的分析中,将调查对象统一归为五类:一般公众,高校师生,图书馆从业者,科研人员,政府、企事业人员。如表2所示,2014-2016年图书馆学问卷调查法文章以一般公众和高校师生为主要调查对象,前者占比持续上升,后者持续下降(指包含某一调查对象的文章数量占表明施测对象的问卷调查法文章总量的比例)。这表明,虽然高校图书馆依然是研究热点,但关注度逐渐转移到公共图书馆。相比之下,对科研人员与政府、企事业人员的调查长期处于较低的比例。这表明,相关研究者在主题及视角选取方面过于集中,主要针对一般公众与高校师生,其他对象涉及较少。
表2 问卷施测对象的种类与比例
3.3 样本量分析
鉴于有效问卷的回收率很难达到100%,因此在统计样本量时,未记录发放问卷数量,只统计有效回收问卷数量,形成样本数量分布图(见图1),横轴代表样本量所在区间,以200为一单位;纵轴为每一区间的样本量所对应的文章数量。在1000以内,样本量小于200的研究连续3年最多,之后呈下降趋势,到800-1000时达到最小值。超出1000的部分因样本量较分散而未按等距处理,但从图1看出,有一定数量的文章也选取了1000以上的样本量。
图1 样本数量分布图
3.4 研究主题分析
2014-2016年的图书馆学问卷调查法文章,根据研究主题可划分为六类:信息及用户信息行为,满意度或需求,图书馆利用与管理建设,图书馆学教育与研究,政府、企事业信息管理,心理认知。由表3看出,以“信息及用户信息行为”为主题的文章最多,长期占据首位;以“满意度或需求”“图书馆利用与管理建设”为主题的研究相对少一些;而主题为“图书馆学教育与研究”“政府、企事业信息管理”“心理认知”的研究最少。对比三年的数据,以“信息及用户信息行为”为主题的研究持续增加;以“满意度或需求”“政府、企事业信息管理”为主题的研究基本保持不变;“图书馆利用与管理建设”“图书馆学教育与研究”“心理认知”文章不断减少。“信息及用户信息行为”研究主题的论文不断攀升,反映图书馆学界的研究热点向信息科学领域转向。
表3 各研究主题的数量及比例
3.5 问卷设计的规范性分析
使用问卷调查法,必须遵循标准化与规范化两个重要原则。为保证研究结论的准确性,研究者必须认真对待前期资料的收集、问卷的设计、预测试、信效度检验以及后期的发放、回收和分析等每一个环节,从而为结论提供科学的数据支撑。由于大多数文章并不对外公开问卷本身,而且许多论文缺少研究设计的清晰说明,因此,只能通过文章中报告的施测过程加以分析和推断。
问卷设计完成后要先进行预测试,以在实践中进行完善。对问卷型的工具,题目重复、语言歧义、语法不清或自相矛盾等问题都可以通过预测试发现;对量表型的工具,预测试扮演着更关键的角色,可检验整个理论架构是否合理、操作性定义是否准确、理论体系的组合方式是否优化等[19]。从2014-2016年问卷的设计与实施指标(见表4)看出,开展预测试的文章较少,特别是问卷类文章,但进行预测试的问卷类文章占发文比例不断提高,而量表类文章虽然比例有所下降,却一直保持较高水平。
表4 问卷的设计与实施指标
进一步对3年的预测试情况进行卡方检验(见表5)后发现,2014-2016年是否提及进行预测试存在显著差异(x2=81.971,p<0.05),两两比较后得出,2014年和2016年具有显著性差异(x2=64.516,p<0.05);2015和2016也存在显著性差异(x2=68.285,p<0.05),2014 年和 2015年无显著性差异。结合表5统计数据判断,2016年提及做预测试的文章占全部问卷调查法文章的比率高于2015年和2014年,说明研究者在预测试方面重视程度有所提升,或在论文写作过程中报告预测试的意识增强。
表5 年份和是否提及预测试交叉列联表
信效度检验在问卷调查中十分关键。信度检验测量问卷的可靠性,效度检验考察问卷的有效性。问卷和量表都应在信效度检验合格后使用,这是提高问卷数据质量必不可少的条件,这样产生的研究结论才具有科学性[20]。根据表4,2014-2016年问卷类文章中信度检验占比13.0%,效度检验占比8.2%;量表类文章中信度检验占比75.0%,效度检验占比65.4%。总体看,量表类文章进行信效度检验的比例高于问卷类文章,表明量表类文章的规范程度高一些。
抽样是指从研究对象的全部单位中抽取部分单位进行考察和分析,并用这部分单位的数量特征去推断总体数量特征的一种调查方法[21]。所选样本是否具有代表性以及研究结果是否具备有效性取决于抽样方法的选择是否合理。在实际研究中,很少文章使用抽样方法。由表4看出,明确报告使用何种抽样方法的问卷类文章和量表类文章分别为12.6%和16.0%,可见对抽样方法的忽视是两类文章存在的共同问题。
3.6 数理统计方法分析
问卷调查中的数理统计分析方法包括描述性统计与推断性统计两种。描述性统计是指研究者利用频数、百分比等组织数据,用众数、中位数、平均数测量数据的集中趋势,用离差和标准差来反映数据的变异性;推理性统计是指研究者利用统计分布、回归分析、统计检验等手段进一步发掘数据,为从样本推论总体提供依据[22]。表6表明,数理统计应用较普遍,多种方法均有使用。其中,描述性统计是应用最多的方法,在问卷和量表类文章中的占比分别为87.0%和90.4%,且数量和比例远高于推断性统计方法。这一方面表明描述性统计方法已经为相当多的研究者所掌握;另一方面也反映出他们对收集到的数据缺乏深入分析,局限于对表象的描述,很难挖掘数据背后包含的意义,难以将成果提升到相应的高度。
表6 问卷与量表类文章数据分析方法使用情况
进一步对3年的假设检验情况进行卡方检验(见表7)后发现,是否提及进行假设检验存在显著差异(x2=6.057,p<0.05),2014年和2015年具有显著性差异(x2=6.0525,p<0.05);2014年和2016年,以及2014年和2015年无显著性差异。结合表7统计数据判断,2015年提及假设检验的文章占全部问卷调查法文章的比率高于2014年。
表7 年份和是否提及假设检验交叉列联表
对三年非参数检验情况进行卡方检验(见表8)后发现,是否提及进行非参数检验存在显著差异(x2=5.975,p<0.05),2014年和 2015年具有显著性差异(x2=5.6906,p<0.05),2015年和2016年存在显著性差异(x2=5.4223,p<0.05),2014年和2016年无显著性差异。结合表8统计数据判断,2015年提及非参数检验的文章占全部问卷调查法文章的比率低于2014年和2016年。
表8 年份和是否提及非参数检验交叉列联表
4 结论与讨论
4.1 研究主题趋于集中,调查群体范围缩小
由研究主题的数量及比例情况(表3)看,研究主题趋于集中,更关注信息价值。近年图书馆学研究愈加集中在信息及用户信息行为方面,可见信息对现代图书馆而言十分重要。图书馆作为信息知识的集散地,是用户查询、获取和利用信息的重要场所,越来越多的学者转向信息及其行为研究。与此同时,对“图书馆学教育与研究”“政府、企事业信息管理”“心理认知”等主题的关注越来越少。
调查群体范围不断缩小,一般公众与高校师生连续3年都是主要的调查对象,而面向科研人员及政府、企事业人员的调查越来越少。前沿热点比较集中,不妨将视角拓宽至新领域,扩大调查对象范围,增强研究的创新性。
4.2 量表类文章的规范性持续高于问卷类
量表和问卷均为测量工具,但相比之下,量表更注重问卷设计的理论框架、测量指标的量化以及结果的数理统计。综合三年数据(见表4、表6),发现对任一问卷设计的指标和数据分析方法而言,量表的使用率持续高出问卷,表明相较问卷类文章,量表类文章的标准化和规范化程度更高,也反映出研究者在对待问卷和量表态度以及严谨程度方面存在较大差异。研究者需提高认识,自觉规范使用各种指标和方法。
4.3 预测试和信效度检验缺失,抽样方法使用率下降
问卷设计完成后需要预测试,一方面可检测问卷中是否存在语言不当或界定含糊等不易暴露的问题,以便在正式发放前修订;另一方面,预测试阶段收集的数据也是信效度检验的基础。问卷和量表作为测量工具,可靠性与有效性是最基本的特性,信效度检验则是考察这两个特性的关键指标。是否需进行信度检验通常与测试内容有关,如测试的是被调查者的态度就需要信度检验,反之则不需要信度检验[23]。效度包括内容效度、校标效度、结构效度,选择哪一种需要依据问卷的研究设计而定。通常情况下,问卷调查法只对内容效度进行检验,量表则需检验多个不同类型的效度。从表4看出,量表类文章使用预测试和信效度检验的比例均高于问卷类文章,表明量表的设计与指标更规范,但规范程度仍然不够。严格意义上这3项指标都应达到100%,也就是说每篇文章都要对使用的研究工具问卷或量表进行预测试,信效度检验合格后才能使用。
抽样方法在问卷调查中也容易被忽视。抽样方式的合理与否直接影响测试结果能否推广到调查对象整体,抽样设计要遵循目的性、可测性、可行性、经济性的原则[24]。表4表明,样本的选取大多缺乏充分且科学的依据,因为只有低于20%的文章明确阐述使用的抽样方法,而且所占比例逐年下降。当然,也存在作者的确使用了抽样方法但在撰写论文时忽略描述的可能。但缺少清晰的叙述,就会给读者一种主观性和随意性的印象,从而影响对论文学术性的评价。
4.4 统计方法单一,数据分析不深入
在2014-2016年图书馆学期刊问卷调查法文章中,描述性统计方法的使用率最高,而假设检验、方差分析、非参数检验、结构方程等数据分析方法只被很少的文章使用。统计方法仍然比较单一,而且绝大多数研究还停留在对数据表象的分析,尚未深入挖掘其内在联系,导致研究结论过于浅显和空泛。研究者应该熟练掌握多种研究方法,并根据研究设计与所获数据的不同,选择最合适的方法开展调查分析,以最大化发挥数据的效用和提升研究的价值。
4.5 论文写作的规范性需提高
撰写问卷调查论文的过程就是实证研究重现的过程。论文写作需要投入极大的耐心与精力,但并非没有章法可循。一般而言,问卷调查类论文含有3方面内容。首先,在研究设计方面,应明确研究问题与调查对象,报告抽样方法与样本情况,总述问卷设计与施测过程以及采用的数理统计方法等,充分显示研究的可行性。其次,在问卷编制与使用方面,先对问卷进行预测试和信效度检验,修订合格后再正式发放,以保证数据的准确性与可靠性。最后,在数据分析方面,需根据研究设计选取恰当的数理统计方法,对数据进行由表及里、由浅入深的分析,得出科学的结论,并将原本复杂的数据转化成易被读者理解的文字,使其具有借鉴和推广价值。
总体来看,现阶段问卷调查法在我国图书馆学领域的应用总体呈现向规范化的良好态势,但也存在不够规范、不够合理等问题,主要原因在于研究者对问卷调查法缺少正确的认识和科学的定位。问卷调查法要求严谨的态度和规范的使用,而大多数研究者并不具备这种意识,设计环节和应用方面的欠合理操作影响了结论的科学性与客观性。长此以往,研究者本身的学术怠慢将使问卷调查法失去社会对它的学术尊重,研究的价值也就不复存在。因此,在图书馆学教育和馆员培训中,应加强方法论的训练以提高规范意识。我们衷心希望,通过规范性的问卷调查,用真实的数据说话,能够成为图书馆界的自觉与共识;更希望在实证研究方法的使用上,研究者都能够持有敬畏之心,尊重各种研究方法自身的科学、标准与规范,更好地开展研究。