共享的边界:CADLIS创新模式再析
2014-04-01刘翔黄晨
刘翔 黄晨
摘要:经过十多年的持续建设,CADLIS已经实现了资源、服务、设备、人力、技术的共享,也在不断寻求共享的突破。借助层级众包的理念挖掘信息用户的智慧,可以实现CADLIS知识服务创新,再一次突破边界实现知识的共享。
关键词:知识服务 层级众包 CADLIS
一、缘起
2007年《大学图书馆学报》发文指出:CADLIS一直在探索技术共享、服务共享、平台共享以及基础信息环境的共享。通过这些共享理念的引入,有效突破共享的边界,让图书馆在融合信息鸿沟、改变人类知识获取的方式等方面有更为积极的作用。在随之而来的CADLIS“十一五”建设中,贯彻这一理念,高等教育数字图书馆建设中的共享领域和范围得到了不断拓展。
我们注意到,在上述文章发表之前一年,杰夫·豪在美国《连线》杂志上首次提出了众包的概念。随后,从亚马逊网站、星巴克咖啡到宝马汽车,众包模式在商业领域取得了广泛成功。而国外图书馆界的众包探索项目也已经取得较好成效,例如:美国国会图书馆照片众包、美国纽约公共图书馆的古籍善本菜单图片众包等。众包其实是共享的一种新模式,它极大地释放了普通用户的创造力,从而产生了巨大的效益和影响。
CADLIS在“十二五”规划中明确:将实现数字图书馆由数据服务向知识服务转变,构建基于Web2.0的互动共享“服务云”,提供不分时间、地点、终端、用户的不间断知识服务,将数字图书馆的信息服务嵌入到用户工作环境、学习环境和日常生活中,构建用户的随身信息环境,使用户通过各种交互方式,随时获取文献信息服务、知识导航服务以及动态的信息传送和传播等服务。
知识服务是指从各种显性和隐性知识资源中按照人们的需要有针对性地提炼知识,并用来解决用户问题的高级阶段的信息服务过程。这种服务的特点就在于,它是一种面向知识内容和解决方案的服务,是通过增值服务帮助用户解决问题,而不是简单地把信息提供给用户。《知识管理十步走》中指出,“隐性知识是知识创新的关键,但大量的隐性知识没有通过文字表达出来”。数字图书馆环境下大量用户的隐性知识是知识服务急待挖掘的金矿。
有鉴于此,我们认为,在知识服务的建设中需要跨越数字图书馆单方面向用户提供信息服务的界限,采用众包模式让用户也成为知识的生产者,实现互动的知识服务。其核心在于,共享将不再局限于机构之间,而会越来越倾向于实践证明了的电商模型:即机构与用户之间的共享(Client to business,C2B),以及用户与用户之间的共享(Client to Client,C2C)。众包将是下一个数字图书馆共建共享取得突破的方向和方法。
二、层级众包与知识服务
从知识服务的内容看,一方面,在当前大数据的背景下,我们需要充分利用对知识资源结构和知识分析规律的深度理解,集成利用各个领域的知识挖掘与分析工具,开发针对复杂知识资源环境的各种知识发现工具,来协助用户进行知识的挖掘、计算、试验和评价;另一方面,更需要注意发现和收集用户的智慧,用户既是知识的消费者也是知识的生产者,专家用户的知识则更具价值。将用户的智慧有效组织并服务于用户是知识服务的重要方向。
从知识服务的架构看,知识的获取过程包含观察、分析、认识、应用和演绎这五个层级,因而知识服务必须能够良好地支持这五个层级的实现。研究表明,对应于知识的获取过程,众包按其所涉及的知识服务专业化程度的不同,也可以有相应的纵深,我们将之称为“层级众包”,如图1所示。
知识获取从上至下表明,知识是从细微的观察到掌握后广泛的使用与演绎,而层级众包对应的众包深度和难度将依次增加,同时众包所能得到的回馈量也依次减少。相应的关系简述如下:
观察是指有目的、有计划、有思维活动的知觉活动。通过观察可以获得大量的感性认识。数据是最原始的信息,观察依赖于大量的有效数据,采用数据众包的方式可以对数据进行纠错、补全,从而完善数据。
分析是知识获取的第二步,是在感性认识所获得的大量先验材料的基础上进行的,依赖于在所观察的数据上提取的有效信息。对应于知识服务而言就是向用户提供各类文献资源。采用资源众包的方式,可以鼓励用户提交或标记有价值的资源,参与到资源的整合和过滤中。
认识是知识获取的第三步,建立在分析的结果之上,依赖于对有价值的资源进行综合、分析、推理后得出概念。对应于知识服务而言,可采用知识众包的方式,允许用户参与到知识再组织上。例如:维基百科提出“人人可以编辑”的口号,允许多人共同提交知识形成知识点,其中英文版已建立词条多达422万,注册用户数5600万。
应用是对所理解知识的直接使用,是知识的实践环节,是用于解决实际问题的一种方式。对应于知识服务而言,就是采用智慧众包的方式来解决具体的问题。像国内著名的威客网站“猪八戒”就采用智慧众包的方式解决某些问题,从其宣传口号“800万人在此聚集,总有一个人能帮你!”,能看出智慧众包解决问题的有效性。
演绎是对所获得知识的升华,将多个来源的知识汇聚后演绎出一种新的知识。如图2所示为贝多芬第五交响曲声轨的视觉效果表达,这张图将音乐和计算机图形学进行了完美的融合,对音乐进行了图像转化,从视觉的角度呈现了听觉之美。实际上,在跨领域合作上,完全可以采用转化众包的方式,将知识再创作的内容众包给有创意、有感悟的用户,实现更高层次的知识创造服务。
三、层级众包助推CADLIS知识服务
基于上述分析,我们可以发现,众包正是互联网的本质共享模式,无论是数据、文献,还是知识、智慧,通过这样一种扁平化、无边界的共享模式,都能够得到最大效率的供求满足。经过了十多年建设的中国高等教育数字图书馆,在新一轮的建设期,围绕数字图书馆建设的核心内容(即资源、数据及服务),可以通过构建如图3所示的各种形式众包,推动“共知、共建、共享”理念的纵深发展。endprint
3.1 数据众包助推资源共知
CADAL项目二期提出了“多维度标签分类实践”,标签的生成包含三个步骤:第一,采用计算机技术由系统自动生成标签。第二,让用户为文献添加标签。第三,通过聚类和挖掘,完成标签的精确化和自组织。这里的第二个步骤实际上就是一个数据众包的过程,让用户及CADAL成员馆参与其中,用户可以对感兴趣的文献进行标引,CADAL成员馆可以对其所提供的文献资源进行标签的审核。
与此相对应,一直以来CALIS联合目录建设基本采用的是各成员馆的书目数据,以B2B的方式构建。受制于成员馆的文献采集方式,系统中的数据大都来自正式出版物,对于大量的灰色文献、OA资源、原生电子书、用户生成内容和流式图书就无能为力了。随着数字图书馆建设的深入,越来越多的非正式出版物将进入馆藏和服务,如果能够在现有基础上引进C2B的方式,利用数据众包,允许用户个体来参与这些资源的建设,使用户与专业馆员成为平台上众包的一分子,就可以在一个开放的众包平台上构建全覆盖、全媒体的联合目录,这将是解决海量资源组织和管理的一个有效途径。
3.2 资源众包助推资源共建
CADLIS一直依托成员馆进行资源建设,这本身就是一个巨大的资源众包平台。但是传统上的共建方式在互联网扁平化的推动下,更进一步走到C2B的众包模型,将会大大加强资源共建。CADAL项目在已经完成250万件资源的基础上,要进一步搜集更多资源的困难会越来越大,通过向所有用户开放和征集的方式,将会最大限度地利用“长尾”效应,实现资源的高效共建。另一方面,在CALIS“十二五”的展望中提到将构建“用户环境系统”,该系统用于支持读者构建完善的个人数字图书馆,包括对CALIS各项资源与服务的集成定制。借助用户环境系统,我们很容易搜集和分析用户的个人资源,采用一定的策略,就可以鼓励用户参与资源共建,从而促进C2B模式的高效运作。而当用户在自己的环境系统中发出文献请求时,系统还可以根据数据挖掘的结果,将相似用户的收藏资源,通过资源发现平台进行推荐,实现以众包为基础的个性化推荐。
3.3 知识众包助推服务共享
根据CADLIS“十二五”规划,中国高等教育数字图书馆将建立各个知识领域较为完整的数字化文献群,构建可以支持决策的各学科、各行业的海量文献知识总库,揭示不同信息、文献的深层次联系,使海量文献从信息转变为知识,并通过跨媒体技术与图像、声音、视频融会贯通,建立跨学科、跨媒体的立体知识结构框架,形成一个巨大的知识网络。面对这样一个宏伟目标,CADAL的知识网络、CALIS的用户环境系统,以及知识众包的方式,为我们打开了一个巨大的想象空间。
用户在CADLIS的开放平台上,可以对所阅读的书籍和论文进行夹注和眉批,也可以提出疑问等待解答。假如是教参书,还可以直接加入课堂笔记或习题解答,甚至利用手机进行课堂录音录影,将音视频加入到书籍中,形成一本由来自不同学校的师生共同“创作”的不断生长的教科书。对于特定知识点的学习,利用资源发现和搜索引擎积累资源,可以借助类似iBooks Author的工具来创作特定主题的原生电子文献,在个人学习研究之余提交系统,实现C2B的交互知识共享;而CALIS正在建设的课题咨询服务也可以朝着知识众包的方式发展,打破以单个学校为单元的概念,按专业领域集中全国高校的咨询馆员,甚至集结一批有专业背景的用户,通过可操作的认证和反馈机制,实现课题咨询、定题服务的跨地域界限的联合咨询服务。
四、结论
长期以来,CADLIS一直致力于数字图书馆建设的“共建、共知、共享”。五年前的旧文描绘了CADLIS共建共享的发展趋势,今天,在成功实现文献、设备、技术和图书馆人力资源共享的基础之上,在新一轮五年规划面前,结合新技术、新媒体的迅猛发展,我们相信,CADLIS必将一次次地超越自身,不断突破共享的边界,实现无边界的共享,达成信息平等和自由的夙愿。endprint