理工科图书出版同质化问题研究
——以“C语言”、“C++”及“混凝土结构”图书为例
2016-05-18许晶晶上海师范大学图书馆上海200234
许晶晶(上海师范大学图书馆 上海 200234)
理工科图书出版同质化问题研究
——以“C语言”、“C++”及“混凝土结构”图书为例
许晶晶
(上海师范大学图书馆上海200234)
〔摘要〕文章以“C语言”、“C++”及“混凝土结构”图书为例,利用内容分析法和直接阅读法,分别提取出参照样本和其他样本图书同质化的十个指标,为指标设置权重并进行计算,按照计算结果判断这三类图书同质化程度,以期为图书采访人员工作提供理论依据。
〔关键词〕同质化内容分析法
〔分类号〕G253
〔引用本文格式〕许晶晶.理工科图书出版同质化问题研究——以“C语言”、“C++”及“混凝土结构”图书为例[J].图书馆,2016(3):56-59
1 引言
所谓“同质化”是指同一大类中不同品牌的商品在性能、外观甚至营销手段上相互模仿,以至逐渐趋同的现象。出版同质化主要表现在出版产品的内容层次,同一类型的出版产品品种重复,且内容替代性强。图书出版是高校图书馆资源建设的上游环节,图书出版状况的好坏直接影响着图书采购工作的质量[1]。当代图书出版的同质化趋势日益严重,图书质量良莠不齐,选择高质量异质化图书成为目前大多数图书馆馆藏资源建设的难题。目前,业界有很多成果都涉及到图书同质化问题,但对于如何利用科学的研究方法判断图书同质化程度,鲜有涉及。
计算机类图书和建筑类图书是理工科图书的重要组成部分,近年随着计算机技术在各行业的日益普及,计算机类图书成为高校馆藏资源建设的重点[1],计算机类图书同类图书数量明显过剩,内容严重同质化[2],“C语言”尤甚,因此,本文将“C语言”图书作为同质化问题研究的第一个案例,再随机选择计算机类图书中的“C++”图书为第二个案例。而建筑类图书品种丰富,近年“混凝土结构”图书数量越来越多,其同质化程度影响建筑类图书的采购,故本文选择“混凝土结构”图书为同质化问题研究的第三个案例。以“C语言”、“C++”及“混凝土结构”三类图书为例,用实证研究的方法对其同质化程度进行客观判断,以期能够为馆藏资源建设提供依据。
2 研究过程
2.1数据来源及样本确定
2.1.1数据来源
考虑到理工科图书时效性强的特点,本文选择2010-2014年最近5年的图书数据。数据源于历年采访数据较全面的中标书商的采访数据,主要有北京人天书店有限公司、湖北三新有限公司、北京百万庄图书公司,几家书商的采访数据相互补充使得选取的图书数据较全。
2.1.2样本确定
对数据以“C语言”为检索词进行文本筛选得到772种图书,对数据以“C++”为检索词进行文本筛选得到379种图书,对数据以“混凝土结构”为检索词进行文本筛选得到183种图书[3]。根据高校图书馆馆藏建设:不采购面向高职高专的图书、不采购考级考证类图书、不采购习题集及图集等原则确定研究对象。根据书目上提供的信息或是根据书名信息判断,进行删除,具体删除如下图书:①各类高职、高专、职业教育、成人教育类教材;②各类职业认证考试、等级考试教材;③各类教学辅导材料、习题集等。 删除后得到“C语言”图书536种,“C++”图书298种,“混凝土结构”图书137种;并采用随机抽样的办法抽取样本,在“C语言”、在“C++”和“混凝土结构”图书中随机抽取各100种图书。
2.2同质化影响因素确定
影响图书同质化的因素很多,主要表现在两方面,一是书名,二是内容。在抽取样本时已经对书名进行了限制,如在选取数据时以“C语言”、“C++”“混凝土结构”为检索词,所选图书书名均有“C语言”、“C++”“混凝土结构”关键词,则视为书名同质化。因此接下来重点考虑内容因素。为了便于研究,本文在“C语言”、“C++”及“混凝土结构”图书样本中各抽取一本书为参照样本。
对于“C语言”、“C++”图书参照样本的选取,参考“基于引文统计的我国计算机类学术性图书出版情况分析”一文[2]的研究结果,即计算机类图书第一核心出版社为清华大学出版社。基于此,用关键词“清华大学出版社”进行删选,对于删选结果进行随机抽样。在“C语言”图书样本中抽取2014年清华大学出版社出版、田丽华主编的《C语言程序设计》为参照样本(在表1中用“样本1”表示),在“C++”图书样本中抽取2012年清华大学出版社出版、田秀霞主编的《C++高级程序设计》为参照样本(在表2中用“样本1”表示)。对于“混凝土结构”图书参照样本的选取,参考笔者“基于引文分析的核心作者研究——以建筑类图书为例”一文的研究结果,即建筑类图书中“建筑结构”方面核心作者单位主要有大连理工大学、同济大学等。基于此,用关键词为“同济大学”进行删选,对于删选结果进行随机抽样,抽取2011年同济大学出版社出版、顾祥林主编的《混凝土结构基本原理》(第2版)为参照样本(在表3中用样本1表示)。
图书内容是需要深入挖掘和认真分析的部分,本文采用内容分析法和直接阅读法来确定内容的要素。“内容分析法是一种对具有明确特性的传播内容进行的客观、系统和定量描述的研究技术。实质是对传播内容所含信息量及其变化的分析。”[4]通过对《C语言程序设计》一书的直接阅读并用内容分析法分析将该书的内容提取为十个关键词,分别为:C语言概述、数据类型、运算符、表达式、程序设计、预处理命令、函数、数组、指针、文件,将这些关键词设置为:要素一、要素二、……要素十,其余99种图书(用样本2、……样本100表示)同样依照这种方法设置要素。例如任意抽取2013年电子工业出版社出版、李俊主编的《C语言程序设计》,与参考样本图书内容进行对比,对于内容主题相同但是语言表达方式不同的可提取为同一个关键词,对于内容主题不同的可提取为不同关键词。李俊主编的《C语言程序设计》一书第一部分是对“C语言”基本内容的概述,主要内容与参考样本图书“C语言概述”主题基本一致,因此该书的第一个关键词提取为“C语言概述”。同样,通过阅读发现李俊主编的《C语言程序设计》没有“运算符”、“程序设计”、“预处理命令”、“函数”、“数组”、“指针”等内容,却多出了“流程控制”、“基本输入/输出语句”等内容,对于与参考样本图书内容相异的部分,将关键词提取为“无”。由此确定李俊主编的《C语言程序设计》内容按照参考样本关键词的顺序提取十个关键词分别为:C语言概述、数据类型、无、表达式、无、无、无、无、无、文件。
“C++”图书关键词的提取方法与“C语言”相同。同理,通过对《C++高级程序设计》一书的阅读将该书的内容提取为十个关键词,分别为:数据类型、流程控制、函数、数组、指针、结构体、类与对象、继承、多态、异常处理,并设置为:要素一、要素二、……要素十,其余99种图书(用样本2、……样本100表示)同样依照内容分析法阅读全书后设置要素。其余样本图书要素的提取与李俊《C语言程序设计》要素提取方法相同。以2013年机械工业出版社出版、温宇杰主编的《深入实践C++模板编程》为例,该书内容不涉及“数据类型”、“流程控制”等内容,则十个关键词分别为:无、无、函数、无、无、无、类与对象、无、无、无。
“混凝土结构”图书关键词提取方法同样如此。通过对《混凝土结构基本原理》一书的阅读将该书的内容提取为十个关键词,分别为:混凝土基本性能、轴心受力构件、受弯构件、偏心受力构件、构件斜截面、构件扭曲、构件受压、预应力、构件使用性能、混凝土结构耐久性,分别设置为:要素一、要素二、……要素十,其余99种图书(用样本2、……样本100表示)同理,与李俊《C语言程序设计》要素提取方法相同。以2014年清华大学出版社出版、李斌主编的《混凝土结构设计原理》为例,提取为十个关键词,分别为:混凝土基本性能、无、受弯构件、无、无、构件扭曲、构件受压、预应力、无、无。
2.3同质化程度判断
分析发现影响同质化程度的内容指标,即反映图书内容做十个关键词(要素一、要素二、……要素十),这些指标为平行关系,对于内容同质化的影响同样重要,用B1、B2、……B10表示,采用直观判断法把B1、B2、……B10指标权重设置为1、1、……1。其余样本2、……样本100中指标与样本1对应位置的指标相同可将该指标权重设置为1,其余情况该指标权重设置为0。例如李俊《C语言程序设计》指标权重为:1、1、0、1、0、0、0、0、0、1;而温宇杰《深入实践C++模板编程》指标权重为:0、0、1、0、0、0、1、0、0、0;李斌《混凝土结构设计原理》指标权重为:1、0、1、0、0、1、1、1、0、0。
对于同质化程度的判断,需要对指标进行权重计算:结果= B1+B2+……+B10,结果<5,视为图书同质化程度较低;结果≥5,视为图书同质化程度较高,结果大于5越多同质化越严重;结果=10,视为两本书完全相同。50%的样本结果≥5则认为该类图书同质化程度较高,反之则认为该类图书同质化程度较低,结果≥5的样本数量越多说明该类图书同质化现象越严重。
3 “C语言”、“C++”及“混凝土结构”同质化程度分析
3.1“C语言”图书同质化程度分析
表1 “C语言”图书同质化程度
根据上述分析列出表1,由表1所示,指标B1同质化达到99%,其余指标分别为:B2 86%、B3 71%、B4 43%、B5 33%、B6 62%、B7 55%、B8 52%、B9 51%、B10 43%。说明“C语言”图书内容同质化主要集中在B1、B2、B3、B6等几个方面,指标B1同质化程度最高,指标B5同质化程度最低。这与“C语言”类图书有关,“C语言概述”是它的基本内容,大部分图书都会有所涉及,而其他方面的内容如“表达式”等著作过程中会根据侧重点不同而有所取舍。70%的“C语言”图书权重计算结果≥5,因此可以判定:“C语言”图书同质化程度较高。
3.2“C++”图书同质化程度分析
以同样的方法分析列出表2,由表2所示,指标B1同质化达到65﹪的比例,其余指标分别为:B2 57%、B3 35%、B4 65%、B5 51%、B6 48%、B7 15%、B8 60%、B9 53%、B10 48%。这说明“C++”图书内容同质化主要集中在B1、B4、B8等几个方面,指标B1同质化程度最高,指标B7同质化程度最低。这与“C++”类图书有关,“函数述”方面的内容是它的核心内容,而其他方面的内容如“结构体”、“类与对象”等属于非核心内容,有些作者会舍去。49%的“C++”图书权重计算结果>5,可以判断出:“C++”类图书同质化程度较低。
表2 “C++”图书同质化程度
3.3“混凝土结构”图书同质化程度分析
表3 “混凝土结构”图书同质化程度
以同样的方法分析列出表3,由表3所示,指标B1同质化达到54﹪的比例,其余指标分别为:B2 18%、B3 54%、B4 9%、B5 40%、B6 43%、B7 9%、B8 31%、B9 3%、B10 13%。这说明“混凝土结构”图书内容同质化主要集中在B1、B3等几个方面,指标B1同质化程度最高,指标B9同质化程度最低。这与“混凝土结构”类图书有关,“混凝土性能”包括物理性能和材料性能等方面的内容是它的基础内容,而“构件使用性能”等方面的内容很多图书都不涉及。26%的“混凝土结构”图书权重计算结果>5,可以判断出:“混凝土结构”图书同质化程度较低。
4 结语
4.1“C语言”、“C++”及“混凝土结构”同质化现状
统计显示,“C语言”图书同质化严重,有19%的“C语言”图书同质化现象非常严重,基本达到雷同。统计显示“C++”类图书同质化程度虽然较低,但是49﹪的比例接近界定同质化程度高低的临界值,这说明“C++”图书目前虽然同质化较低但是有同质化恶性发展趋势。统计显示,“混凝土结构”图书同质化程度明显较低。
统计结果说明,“C语言”图书出版质量较低,图书内容大同小异;与“C语言”图书相比,“C++”图书出版质量稍好;“混凝土结构”图书出版质量相对最好。主要原因有:①“C语言”图书中学术专著极少,教程类图书占多数,因此难有创新,不同作者之间相互模仿借鉴,核心内容不变,造成内容上的低水平重复;②研究中涉及到30家以上的出版社,但不同出版社“C语言”图书内容同质化仍然严重,对此出版社负有不可推卸的责任:为了获取高额利润,抢占市场份额,走跟风出版的捷径;对于图书知识产权的保护不到位等等,缺少高质量的原创图书。
4.2“C语言”、“C++”及“混凝土结构”图书同质化对采购决策的影响
为了提高文献资源的收藏质量,必须采用科学的方法进行筛选,才能保证图书采购的“全而不滥”。目前,图书采购方式主要有两种:一种是以书展为依托,采访人员根据样书或库存进行的现货采购;一种是以各种书目信息为依托,以书目预订为渠道的期货采购。现货采购无法同时对馆藏图书进行有效对比和分析,往往会造成时间和精力的浪费, 因此在“C语言”和“C++”图书采购中宜采用期货采购搭配科学的采购策略,“混凝土结构”则可采用现货采购和期货采购相结合的采购策略。
“C语言”图书同质化严重,甚至有雷同现象,采购人员在采购该类图书时不仅要慎重,还要减少该类图书的采购。笔者对所在图书馆“C语言”馆藏图书进行了统计,出版时间在2008-2012年的接近百种,说明该类图书馆藏丰富,能够满足读者需求,后期只需部分更新即可;将采购重点放在读者荐购上,根据读者的实际需求有效补充馆藏,避免同质化带来的资源浪费。
“C++”类图书虽然同质化程度较低,但采购人员要注意:认真对比书目信息与馆藏图书信息的异同,借此判断新书是否与馆藏图书同质化,若是则不予采购,反之则正常采购;可以采用“核心出版社”的方法进行采购,利用既往研究成果,对清华大学出版社、机械工业出版社、电子工业出版社等核心出版社的计算机类图书进行采购;考虑到“C++”图书有同质化恶性发展趋势,采购人员也要适当减少该类图书的采购。
“混凝土结构”图书同质化程度较低,采购人员可以根据采购政策正常补充馆藏。但是该类图书的采购对采购人员的知识储备要求很高,采购人员要熟悉这类图书内容的知识要点,因此要积极补充这方面的专业知识[5],在知识背景的指导下才能更加科学合理的采购图书,有效防止入藏图书同质化的出现。
(来稿时间:2015年12月)
参考文献:
1.林雅萍, 刘惠敏, 蔡迎春, 等.从出版统计和馆藏分析看图书采购策略 ——以2002-2005年国内出版的计算机类图书为例[J].图书情报知识, 2009(3):117-121
2.陆怡洲.基于引文统计的我国计算机类学术性图书出版情况分析[J].图书馆论坛, 2009(4):165-167,145
3.蔡迎春.回眸与展望:民国档案学术研究的发展现状与特征[J].上海师范大学学报(哲学社会科学版), 2015(5):110-117
4.蔡璐.基于学科主题进行细分的高校图书馆馆藏质量研究——以高等教育学科为例[J].图书与情报, 2011(2):118-121
5.吴志荣.论我国图书馆学研究中的外部反思现象[J].上海师范大学学报(哲学社会科学版), 2015(5):103-109
·实证研究·
A Study on the Homogeneity of Science and Technology Books Publication——Taking“C Language”“C++”and“Concrete Structure” as Examples
Xu Jingjing
( Library of Shanghai Normal University )
Abstract〔〕Taking“C language”、“C++”and“concrete structure” as examples, and by content analysis method and directly reading method, this paper respectively extracts ten indexes of reference sample and other sample books and calculates the set weights for indexes according to the calculation results to determine the degree of homogeneity of these books in order to provide theoretical basises for our purchasing personnel.
Keywords〔〕HomogenizationContent analysis method
〔作者简介〕许晶晶(1982-),女,硕士,上海师范大学图书馆资源建设部馆员,研究方向:图书馆知识服务、采访策略等。