学术机构知识库生命周期成本构成研究
2015-12-14李大玲杨琪
李大玲++杨琪
〔摘要〕从投入要素的角度来看,学术机构知识库生命周期的成本构成主要包括人力成本、物力成本和信息成本。对学术机构知识库生命周期的5个不同阶段产生的各类成本进行了分析,发现人力成本在规划阶段、开发阶段、部署阶段和运行维护阶段都是必不可少的成本构成。物力成本主要涉及开发、部署和运行维护阶段。信息成本以知识产权成本、宣传推广成本和知识对象加工录入成本为核心,兼顾停止运行阶段的数据迁移成本。并给出为了与学术机构的发展战略目标保持一致,需要科学预测成本投入,全面评估人力成本和信息成本,合理考察开发方式降低物理成本的建议。
〔关键词〕学术机构知识库;生命周期;成本构成;人力成本;物力成本;信息成本
DOI:10.3969/j.issn.1008-0821.2015.10.003
〔中图分类号〕G25074〔文献标识码〕A〔文章编号〕1008-0821(2015)10-0012-05
Cost Components of Institutional Repository During its Whole Life-CycleLi Daling1,2Yang Qi2
(1.Tianjin Institute of Scientific and Technical Information,Tianjin 300074,China;
2.Tianjin University of Commence,Tianjin 300134,China)
〔Abstract〕Labor costs,material costs and information-related costs spent on at least one of the five stages of Institution Repository during its whole life-cycle.After analyzed the cost produced during the Planning,Development,Deployment,Maintenance,Termination stages,this paper found that the Labor cost existed from Planning stage to Operation and Maintenance phase.Material cost included software,hardware and operational environmental assurance.Intellectual property costs,promotion costs and knowledge processing input costs were the core of Information-related cost.
〔Key words〕institutional repository;life cycle;knowledge management;labor costs;material costs;information-related costs
生命周期理论是基于生物体从出生、成长到老化、死亡的生命历程的“生命周期”现象而提出来的[1]。学术机构知识库作为组织知识管理的重要平台和工具,其本身也有从产生到消亡的"生命周期"。从全球学术机构知识库发展来看,随着知识在产业发展中地位的不断提升,各国都在加大学术机构知识库的建设与研究,据开放存取知识库名录统计[2],截至2015年7月,全球机构知识库的数量从2008年的1 366个,发展到了2 931个,7年时间增长了115%。2 931个机构知识库中,正在运行的机构知识库有2 753个,占939%;处于测试阶段的有91个,占31%;机器自动链接检测连接不上服务器的有66个;已经关闭的有21个。国内外对学术机构知识库的生命周期研究和成本研究都还处于起步阶段,虽然有学者对高校图书馆自建特色知识库的生命周期延长[3]、数字图书馆生命周期组织文化建设[4]、基于资源生命周期的机构知识库成本模型[5]、以及基于产品生命周期成本的本体知识库[6]等相关问题展开研究,但是,基于学术机构知识库全生命周期的不同阶段的成本构成的问题依然是需要深入探讨。从经济学的角度来看,成本费用分析法运用于管理部门的计划决策之中,可以寻求在决策上如何以最小的成本获得最大的收益[7]。从学术机构知识库全生命周期的角度对可选择的行动过程将获得的各种利益和计划付出的成本进行测定,并将成本和利益结合起来加以合理的分析,特别是发现和比较那些需要加以考虑的因素,然后在供选择的机构知识库相关政策与支持项目之间进行抉择,无疑对更好地量化学术机构知识库的成本管理、确保机构知识库的高效运行有着重要价值。
2015年10月第35卷第10期现?代?情?报Journal of Modern InformationOct,2015Vol35No102015年10月第35卷第10期学术机构知识库生命周期成本构成研究Oct,2015Vol35No101学术机构知识库生命周期模型
学术机构知识库的建设依赖特定的软件[8],如DSpace、Eprints、Digital Commons、OPUS、dLibra、Greenstone、Fedora等,学术机构也可以自行设计学术机构知识库软件。这些软件虽然设计原则和应用目标各具特色,但是作为软件,都要依据一定的机构环境和要求进行设计,也有孕育、诞生、成长、成熟和衰亡的过程,这个过程就是软件开发生命周期。传统软件工程理论把这个过程划分为软件定义、软件开发和运行维护3个时期,这3个时期构成著名的传统软件生命周期理论[9]。有学者指出[10],软件生命周期应当包括从考虑其概念开始到该软件产品交付使用、直至最终退役为止的整个过程,一般包括计划、分析、设计、实现、测试、集成、交付、维护等活动。在实践活动中并不完全按照这些阶段逐一进行下去,而是一种迭代执行状态。endprint
学术机构知识库作为基于软件运行的动态数据集合,其生命周期也符合一般软件生命周期的特征,应当包括学术机构知识库存在的全过程,即从开始规划到停止运行的各个阶段的总和,具体包括规划阶段、开发阶段、部署阶段、运行和维护阶段、停止运行期,如图1所示。
图1学术机构知识库生命周期模型
其中,为了提升学术机构知识库的服务效益,随着机构知识库软件的升级以及用户和管理者对系统功能的要求不断提高,可能会对机构知识库进行二次开发和部署。因此学术机构知识库生命周期不是一个简单线性的过程,中间可能出现多次开发和功能提升的过程,同时需要对硬件进行新的部署。这均会增加学术机构知识库的成本。
2学术机构知识库成本的含义
成本是人类为实现一定的目标所付出的价值代价。美国会计学会所属成本概念与标准委员会认为,成本是为达到特定目的而发生或应发生的价值牺牲,是可以用货币单位加以衡量的价值。但是一直以来,学术界对此有不同的意见,认为价值牺牲不仅包括可以用货币单位计量的部分,还应当包括无法用货币计量的部分[11]。将无法用货币计量的价值部分也纳入到成本的范畴,更能完整体现价值牺牲的全部。因此,本文认为,学术机构知识库的成本也应包括这两部分:学术机构知识库在建设、维护和可持续发展过程中所投入和消耗的可以用货币计量和不能用货币计量的投入的总和。从生命周期的角度看,学术机构知识库总成本应当由生命周期中各个阶段产生的成本组成。
学术机构知识库的成本按照不同的维度,有不同的分类方式。按照是否可控,分为可控成本和不可控成本;按照是否固定,分为固定成本和可变成本;按照是否可以度量,分为可核算成本和不可核算成本;按照职能的不同分为运行成本和管理成本;按照投入要素,又可以分为人力成本、物力成本(设备、软件、空间、网络环境等成本),由于知识和信息正日益成为现代成本的重要构成要素之一[12],因此,还包括信息成本。从投入全要素来看,人员、软件、硬件、内容、对机构知识库的认知、知识产权授权、增值服务、管理职责和机构知识库的利用等都是学术机构知识库的成本构成要素[13]。本文从投入要素的角度来分析学术机构知识库生命周期的成本构成,主要包括人力成本、物力成本和信息成本3个方面。
人力成本是贯穿机构库生命周期始终的影响因素,人力成本包括建设初期的系统开发者、运行维护过程中的系统录入员、推广宣传成员以及机构库的维护管理员等学术机构知识库参与者的人力成本。人力成本的构成要素主要有获取成本、使用成本、培训和学习成本和离职成本等。在实践中,由于工作人员除了学术机构知识库的工作之外,还有其他的工作职责,因此容易造成学术机构知识库建设的人员成本较难计算。具体来说,学术机构知识库的人力成本主要包括:①聘用学术机构知识库工作团队而产生的费用(含人员选拔费用、考核费用、会议费用、差旅费用等);②人力资源的使用成本(在机构库建设过程中需要支付的人员工资、办公经费、专家学者劳务费等);③机构库团队成员培训成本(包括岗前培训和执行任务中的学习、交流与培训等产生的费用);④其他成本(如:在机构库的建设期间有人员离职而造成职位空缺而产生的离职成本,人员短缺造成其他人工作量的增加或者机构库建设时间的延长产生的成本等)。
物力成本主要包括学术机构知识库建设全部周期内所需要用到的软件、硬件及其运行产生的成本,如:软件部分有软件选型成本、开发成本、开发工具成本等;硬件部分有计算机、网络材料、网络设备、办公设备、机房等;运行产生的成本包括设备运行产生的需要分摊的电费、暖气费等。
信息成本主要包括:知识库收录公开发表或出版的学术论文、学位论文、专著等知识对象,获得出版机构的许可所需要支付的费用,以及纸质知识对象数字化的费用等。
3学术机构知识库生命周期成本构成
31规划阶段
规划阶段的成本主要由人力成本构成。由于机构知识库项目规划小组的人员投入到知识库的工作时间不同,单位时间不同角色的人员成本也不同,因此,一般计算人力成本时,不同角色人员的成本要乘以一定的系数,以区别不同人员花费1小时所产生的不同成本。但是,因为国外学术机构各类人员的薪金水平是保密的,所以本文参考岗位职责的重要性来确定相应的权重。其计算公式为:
规划阶段成本公式:
C规划=R1r1+R2r2+R3r3+…+Rnrn(1)
其中,Rn为机构知识库规划中第n个参与者的工作时间,以小时为单位,rn为机构知识库第n个参与人员的岗位职责系数,Rnrn即第n个规划参与者的成本。其他阶段的人力成本也可参考公式(1)进行核算。
32开发阶段
开发阶段的成本包括软件选型成本、开发成本、人力成本等。学术机构知识库的开发阶段的成本公式如公式(2)所示。
学术机构知识库开发阶段成本:
C开发=D1+D2+D3(其中,D2=∑di+Dt+De)(2)
其中,D1为机构知识库软件选型成本;D2为开发成本,D2=∑di+Dt+De,di为机构知识库开发各功能模块的开发成本,Dt为开发工具的成本,De是在开发机构知识库运行不佳的情况下重新开发的成本;D3为人力成本。
机构知识库软件选型成本主要包括对不同机构知识库现成软件的功能、适用性等比较分析的产生的成本以及不同软件试用产生的成本。
开发成本中,需要注意的是:①机构知识库开发各功能模块的具体成本需根据模块数量和功能多少而定。②开发工具成本除了付费的操作系统、数据库系统、测试工具、管理工具等等之外,采用免费开源软件的成本也应计算在内。开源软件虽然免费,但是使用成本也不一定为零,比如Open Repository软件根据科研机构的需求,采取变动价格方式,安装费用为9 900美元,每年的运行维护费为4 950美元[14]。③由于技术更新换代的加速和需求的变化,机构库就需要重新开发或部分重新开发,因此重新开发的成本De也是需要重视的。如美国罗彻斯特大学(University of Rochester)在2002年使用DSpace建立了机构知识库,发现机构知识库的功能不能吸引科研人员主动参与,数据主要靠管理员添加。在2009年,该大学组织了相关人员实际参与学校的科研过程,了解科研人员需求,在此基础上利用开源软件开发了IR+系统[15]。endprint
在开发阶段人力成本上,需要注意的是人力成本和开发工具的选用也是直接相关的。CSean Burns对美国机构知识库调研发现[13],采用开源软件开发机构知识库的人力成本相当于个性化机构知识库开发人力成本的一半,而且硬件成本和软件成本也都比个性化机构库的少(如表1所示)。表1不同软件类型的设计的人工、软件和硬件成
其中,D4为人力成本,D5为硬件成本,D6为软件成本,D7为部署测试需要的网络和带宽分摊的成本。
硬件成本主要包括新购置或者分摊服务器、网络设备、台式机等设备的费用。硬件的成本资金的投入在整个生命周期中相对比例较高,特别是在机构知识库联盟结构中,要涉及的成本尤其高,主要是要采购服务器和存储阵列。硬件成本存在一次购置,多个环节分摊的特点,比如为分摊到其他应用上,或者在运行阶段分摊等。软件成本主要包括部署机构知识库所支持的服务器的操作系统和管理系统的软件成本。网络和带宽成本分摊在部署阶段和运行维护阶段。
34运行和维护阶段
学术机构知识库的运行和维护成本主要包括:知识产权成本、知识对象加工成本、知识对象录入成本、人力成本、宣传和推广成本、知识对象管理成本以及机构知识库正常运行支持环境成本(含所需要的网络、机房等基础设施成本以及设备运行产生的需要分摊的电费、暖气费等)。其计算公式如下:
学术机构知识库运行和维护阶段成本:
C运行和维护=M1+M2+M3+M4+M5+M6+M7(4)
其中,M1为知识产权成本,M2为知识对象加工成本,M3为知识对象录入成本,M4为人力成本,M5为宣传和推广成本,M6为知识对象管理成本,M7为运行支持环境成本。
知识产权成本指知识知识库收录公开发表或出版的学术论文、学位论文、专著等知识对象,获得出版机构的许可所需要支付的费用。知识对象加工成本指对拟收录到机构知识库的纸质数字对象进行扫描数字化所需要投入的设备、格式转化等成本。Mary Piorun对Lamar Soutter图书馆数字化学位论文的成本进行了分析[16],指出数字化320篇博士学位论文,并存储到机构知识库的成本为23 562美元,合028美元/页,数字化的时间成本为906小时,每篇博士学位论文数字化用时为170分钟。此外,获取作者的数字化授权耗费了133小时,替代论文中的签名页额外耗费了26个小时(见表2)。
表2数字化学位论文预估成本和实际成本对照表
项目小时劳动成本/成本(美元)每个文档最小成本每个文件的成本(美元)每页成本(美元)预估实际预估实际预估实际预估实际预估实际扫描2252404 5004 800454515001500006006质量控制2251335 6252 92645251875914008004文摘OCR1001602 5003 52020308331100003004添入知识库100542 5001 8902010833591003002签?名?页1332 926259140004替代文档2691052840001项目管理751602 6255 60015308751750004007设备软件10 000990合计72590627 75023 56214517059177054024028备注:预估每篇博士论文250页,预估成本的论文数为300篇,实际成本为320篇。来源:参考文献[16]。知识对象录入成本主要指数字化的知识对象采集入库的成本,知识对象的录入方式不同,成本也有细微的差别。如果采取人工录入方式则录入成本是人工成本的一部分,如果录入是通过购买特定资源上的数据导入机构知识库则表现为信息费用。
运行和维护阶段人力成本涉及的人员主要包括:知识对象收录人员、审核人员、数据库的管理维护人员、服务人员等,有全职人员、专业人员、辅助专业人员、行政人员和学生等,其中专职人员承担的责任最大。这一阶段人力成本的量化度量可以通过工作人员自行填写工作记录,确定该项工作用时来计算;也可以通过机构知识库系统登录日志中记录的人员在线时间来计算。
宣传和推广成本包括运行之初的宣传成本和运行过程中的宣传推广成本;学术机构首先要对学术机构知识库的实施背景、目标、收益等进行宣传,提高工作人员的认知,这个过程均产生相应的成本。
知识对象管理成本包括元数据的采集、抽取成本、加工成本、保存、服务等机构知识库的维护成本。其中,知识对象的保存需要分摊部署阶段的硬件成本,比如存储设备、服务器、电脑等。该部分成本往往由相应的项目支持。可以通过宣传成本的投入降低技术的维护成本,这是因为通过宣传推广,增强了科研人员和其他相关人员对机构知识库的认识,通过培训,提高了维护机构知识库的技能,这均可以提高资源整合的效率,降低维护的技术成本。
机构知识库正常运行支持环境成本,依托学术机构知识库的建设者和部署机构,是科研机构的图书馆,由于图书馆作为信息服务的阵地,设置了网络中心或者信息中心,建设机构库除了购买部署阶段的服务器和存储外,还需要购进交换机、UPS不间断电源、硬件防火墙等,将使得硬件成本增加。因此,应尽量选择完善的网络中心作为机构库的存放地址,这样不仅节约技术成本,还能保障数据安全。运行环境的成本需要相关项目的支持,也有的项目从外部获得资金支持,比如通过学校、区域或者国家基金等。
35停止运行阶段
学术机构知识库停止运行有两种情况:其一是学术机构知识库所在科研单位决定加入学术机构知识库联盟,即把现有机构知识库的内容和用户数据迁移到机构知识库联盟中,现有机构知识库停止运行;其二是由于机构知识库运行效果不理想、项目经费不足、人员流动、机构知识库建设与运行相关项目结项等主观和客观等原因,造成的学术机构知识库关闭,停止运行。对于第一种情况,停止运行的成本主要涉及原有机构知识库的数据迁移成本;第二种情况涉及的成本主要是机构知识库的知识对象的元数据和原文的导出保存成本,以备其他应用系统使用。endprint
4结论与建议
成本问题贯穿学术机构知识库整个生命周期,是学术机构知识库建设的关键问题。学术机构知识库的成本主要由人力成本、物力成本和信息成本构成,在机构知识库生命周期的不同发展阶段,成本构成三部分各自所占比例也有所不同,具体内容也有差别。人力成本是学术机构知识库全生命周期都涉及的成本,但不同阶段的复杂程度不同。规划阶段涉及的人力成本主要是规划小组人员成本,开发阶段人力成本受到开发软件及方式的影响较大,运行维护阶段的人员成本最为复杂,包括知识对象加工、录入、宣传推广和知识对象管理等工作产生的人力成本;物力成本主要涉及开发、部署和运行维护阶段,以软硬件成本为主要组成部分,并包含机构知识库运行需要的良好环境成本。物力成本受到不同开发方式的影响,属于可控的可变成本;信息成本以知识产权成本、宣传推广成本和知识对象加工录入成本为核心,兼顾停止运行阶段的数据迁移成本。信息成本属于可变成本,受到机构知识库收录规模的影响。
学术机构知识库生命周期的各个阶段成本构成分析,是科学安排与规划学术机构知识库建设进程的重要依据,也是科学合理安排资金和人员、有效控制机构知识库建设成本,全面提升学术机构知识库的建设效率的前提和基础。从学术机构知识库生命周期不同阶段的成本构成角度来看,建设知识库应注意以下几个关键问题:
(1)在学术机构知识库建设的规划阶段,应充分研究知识库生命周期各阶段成本构成的内容与特点,结合机构知识库的战略目标和未来市场变化,科学测算知识库全生命周期的成本总量和各阶段投入,为学术机构知识库建设的健康发展打下基础。
(2)学术机构知识库建设的各个阶段所需的人力资源成本是所有成本构成中最复杂的部分,需要全面评估各阶段的工作负荷、用人要求,结合人力资源市场供求状况,做好人力资源成本测算工作。
(3)学术机构知识库的物力成本因开发方式不同而不同,在知识库规划阶段,应当充分考察和评估不同的知识库开发方式,选择其中最适合本机构的方式,以确保知识库建设目标的实现。
(4)学术机构知识库的信息成本与知识库的收录规模及战略定位直接相关,规模越大,战略定位越高,信息成本就越高。因此,在建设知识库的过程中,学术机构应根据组织战略和知识库建设战略全面测算知识库的知识规模,对信息成本做出科学预算。
(5)学术机构知识库的生命周期与组织战略密切相关,而且知识库的建设本身也是学术机构的重要战略行为,学术机构的建成与正式运行并不意味着投入的结束,进入到正式运行阶段以后,仍需要大量投入人力、物力和信息成本。知识库建设全生命周期本身就是一个持续消耗的过程,学术机构应当充分利用好知识库,提高使用效率,并加强知识库使用效率的评估与分析。只有把成本分析与效率评估结合起来,才能获得投入产出的科学认知,从而不断提高学术机构知识库建设的效率和影响力。
参考文献
[1](美)伊查克·爱迪思.企业生命周期[M].赵壑,译.北京:华夏出版社,2004:8.
[2]开放存取知识库名录官网[EB/OL].http:∥www.opendoar.org/,2015-05-25.
[3]吴绮云,刘俊杰,赵慧真.高校图书馆自建特色库生命周期延长策略:以泉州运动鞋类信息数据库的更新维护为例[J].河南图书馆学刊,2015,(1):45-47.
[4]胡翠红.基于数字图书馆不同生命周期的组织文化[J].现代情报,2006,(1):101-102.
[5]庞恩旭,张倩,何芸.基于资源生命周期的机构知识库成本模型研究[J].图书馆工作与研究,2014,(3):27-31.
[6]李世辉,韩庆兰.基于生命周期成本管理的知识库构建研究[J].会计研究,2013,(7):35-41.
[7]邓子基.现代西方财政学[M].北京:中国财政经济出版社.1994:186.
[8]李大玲.学术机构知识库构建模式研究[M].上海:上海交通大学出版社,2009:45.
[9]张斌,郭军.软件工程及应用[M].沈阳:东北大学出版社,2007:43.
[10]陈长顺.计算机导论[M].北京:清华大学出版社,2010:196.
[11]朱学义.会计改革热点研究[M].北京:中国经济出版社,2009:90.
[12]闫星宇.产业模块化研究[M].南京:南京大学出版社,2009:66-67.
[13]C.Sean Burns,Amy Lana,John MBudd.Institutional Repositories:Costs and Benefits[EB/OL].http:∥www.cais-acsi.ca/proceedings/2012/caisacsi201210burns.pdf,2015-03-02.
[14]An easy and cost-effective solution for setting up institutional repositories[EB/OL].http:∥oai5.web.cern.ch/oai5/images/posters/14-tate.pdf,2015-03-20.
[15]张旺强,祝忠明,卢利农,等.几种典型新型开源机构知识库软件的比较分析[A]∥2013中国机构知识库学术研讨会论文集[C].2013:1-11.
[16]Mary Piorun.Digitizing Dissertations for an Institutional Repository:A Process and Cost Analysis[J].J Med Libr Assoc,2008,96(3):223-229.
(本文责任编辑:马卓)endprint