认知计算:数据密集型环境下图书情报学研究的新领域
2019-02-25王祥丽
王祥丽
(1.隆昌市图书馆 四川隆昌 511083)
随着大数据和人工智能时代的到来及发展,机器学习的研究重心已开始从感知领域转移到认知领域, 如何提升对大规模数据的认知能力已成为智能科学与技术的一大研究热点。开发具备感知、理解和行为能力的信息系统和应用程序, 进而实现对万物世界的情景感知与智能计算,已成为IT 界乃至相关领域探索并已取得巨大进展的一大新领域。 作为人工智能认知计算技术代表的IBMWatson 技术平台,自推出以来就被世界所叹为观止,并被誉赞为“让世界正变得更健康、更安全、更富创造力”。 从功能层面上讲, 认知系统具备人类的某些认知能力, 能够出色完成对数据的发现、理解、推理、决策等特定认知任务,主要由认知计算来完成,而对数据的认知价值也就决定了认知计算将在当前大数据与人工智能时代具有的光辉未来。 根据麦肯锡预测,到2025 年,移动互联网、知识工作自动化、物联网、云、先进机器人、自动汽车这六大技术领域相关的产业,经济规模将达到数以十万亿美元, 而这些产业都离不开认知计算。 一直紧跟着技术而推动学科及事业发展的图书情报学界也看到了认知计算的价值与潜力, 早在2002 年就提出了认知情报学这一认知计算与图书情报学交叉结合的前沿领域。人工智能时代的到来,以及认知计算在人机交互、 分析洞察和决策支持等领域的深度应用, 都预示着认知计算这一前沿技术将成为图书情报学学术研究的下一个热点。
1 认识认知计算
1.1 认知计算的概念及应用
认知计算是代表一种建立在神经网络和深度学习之上的全新计算模式,集成了信息分析、自然语言处理和机器学习等创新技术,德勤咨询(Deloitte Consulting)首席分析师Paul Roma 指出,认知计算能够借助技术和算法自动从数据中提取概念、 梳理关系和理解含义, 并独立地从数据模式和先前经验中进行学习,最终拓展人或机器可以自行完成的工作。基于这一认知,Roma 细分了认知计算的三种主要应用方式:
(1)认知自动化,借助于机器人或自动化设施自动执行重复性任务,从而提高效率、质量和准确性。
(2)认知洞察力,可揭示隐藏在大数据中的数据模式和发展关系,从而找到新的创新与发展机遇。
(3)认知参与,可通过大规模提供超个性化设置改善客户关系、提升用户体验,进而推动客户行为。
1.2 认知计算与人工智能
认知计算是一个机器通过与人的自然语言交流及不断学习, 从而最终帮助人类从海量复杂的数据中发现更多规律或本质, 从而做出更为科学精准决策的系统。 而人工智能则是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能与认知计算密不可分但又有所区别,事实上,两者就像是两个部分重叠的圆圈,彼此联系又有所差异(见表1)。
总体来说, 人类追求人工智能的目标是追求机器的类人逻辑和完美, 即一方面让机器尽可能的具有人类的逻辑思维,直至完美,让机器等于人类;另一方面让机器尽可能只学习人类思维中的有益部分,从而形成更加完美的机器逻辑,让机器大于等于人类。 认知计算虽然借鉴了机器学习、 自然语言处理、语音/视觉识别、人机交互等人工智能技术,却追求机器在软硬件设计上变得更具情感和影响力,以帮助人类进行更加专业化的思考和科学决策。
2 认知计算与图书情报学发展
2.1 从信息科学到交叉科学:大数据时代认知计算对图书情报学的发展影响
大数据社会及人工智能时代的到来, 加速了社会对数据、信息的关注与挖掘,一方面传统的信息科学得到了极大的发展, 研究的内涵与发展的边际得到了极大的提升与扩展; 另一方面, 由信息科学交叉、衍生发展而来的计算科学、数据科学、生物信息科学等也在技术、数据、应用的多重驱动下得到了飞跃发展。 图书情报学作为一门兼具有信息科学与管理科学属性的科学, 自然离不开对信息、 技术的追随, 也借大数据、 人工智能时代的发展而在数据挖掘、情感分析、用户计算等领域有了巨大的发展,认知计算也被图书情报学界视为新的发展驱动, 并发展而成为认知情报学这一交叉发展分支。 在图书情报学特别是情报学界的探索下, 认知计算对图书情报学的发展影响、应用场景等逐渐清晰。
庞娜在2018 年分析了认知情报学对情报分析带来的新机遇新场景, 认为认知情报学为情报分析带来了丰富的解决方案、重新定义知识发现、全新的人机交互环境。毋庸置疑,这些影响也依然是认知计算带给图书情报学的影响, 并在新的数据密集型科学研究环境下蕴含了更为丰富的内涵及内容。
(1)丰富情报分析解决方案。大数据时代情报科学及情报工作对数据的分析和挖掘, 让情报分析成为了情报学在大数据时代发展最为活跃的分支领域之一。 然而,情报学研究者和实践者均为重视的大数据由于数据量之大、数据类型之广、生产速度之快、数据质量之痛,这就为情报人员对数据的利用和价值发现提出了挑战, 大量的数据特别是非结构化数据、半结构化数据并未得到充分应用。 主要用来设计和分析大数据集的认知计算, 则可以通过创建特定的应用场景和不断的人机互动、人与环境互动,模拟人类的思维快速的对大数据集进行学习、 推理和分析,以作出无偏倚的科学决策建议,最终对大数据的情报分析及应用提供新的解决方案。 如依托认知计算对海量文献中的药物、疾病、事件等实体进行分析,自动推理出实体间的关系及事件的发展规律。 诸如此类对海量文献、音视频、图像、自媒体、富媒体等海量数据的处理, 都可为数字图书馆及情报服务机构的资源建设及图情事业发展转型提供新的可能及思路。
表1 认知计算与人工智能的差别[4]
(2)重新定义知识发现。 早在10 年前,我国情报学家冷伏海就指出在情报分析方面, 传统的基于数据计算的数据挖掘技术正向基于内容的知识发现技术发展。 随后10 年的发展也证明了这一科学论断的前瞻性与科学性,以Alma、Primo 等为代表的图书馆新一代知识服务系统得到了普及应用, 面向各类知识内容(领域、主题、学者、机构、传媒、资助等)做唯一标识、粒度分析、关联呈现,得以实现从情报分析视角对隐含知识关联做深入挖掘, 同时支撑客户的学科评估、人才评估、研究方向分析、竞争情报动态连续追踪等知识服务成为了图书情报机构近年来知识服务的增长点。 但在基于内容的知识发现实现过程中, 捕捉非结构化数据中蕴含的深层含义一直是一大难点,自然语言处理面临着多重困难。认知计算由于借鉴了人的思维模型和过程, 可以通过对某个特定领域的语言、术语进行人机交互、人与环境的互动交互来分析和理解, 最后实现基于情报分析的自动知识发现和含有细粒度实体的知识图谱绘制。这对图书情报机构而言无疑是非常重要的, 因为其不但能帮助图书情报机构实现对期刊论文、 论文实证数据、参考文献、专利、实验标本、作者、主题领域等细粒度知识的自动发现, 还可以对细粒度实体间关系的关联及发现来对整个篇章知识结构进行知识发现,帮助用户迅速发现文章的研究目的、方法、手段、工具、结论等脉络,运用关联数据等技术帮助图书情报机构的用户在数据密集型环境下高效地获取及利用文献,加快知识服务的发展。
(3)新型的人机交互环境。数据密集型科研第四范式对图书情报领域的技术应用提供了更多可能与场景,借助于人机交互的情景感知如智能咨询、机器问答等也便成了人们在复杂、混沌、不确定的现实世界中对海量、 异构和难以理解的数据处理的幻想。追寻图书情报学领域的人机交互历史, 可以发现从较早信息检索到近年来发展的视觉搜索, 都注重对用户认知的感知与理解, 人工智能助推的问答式服务、无人智能服务、在线智慧系统等也均提升了情报服务的人机交互水平, 并创新出了越来越多的服务应用场景。认知计算利用深刻的理解能力,可以辅助图书情报机构在为用户进行服务时提供更佳的解决方案,如既可将解决方案嵌入到用户的搜索、浏览等行为中去,也可以在智能问答系统、导航机器人程序中提前植入,让用户与机器进行深度的交互,并为用户提供更加高效、合理的决策建议。
2.2 从认知计算到认知情报学:认知计算与图书情报学的交叉领域
发展于20 世纪50 年代、主要包含计算机科学、心理学、教育学等多个学科知识的认知科学,在信息时代和大数据时代随着对数据和信息的计算处理而发展形成了认知计算这一技术综合体。 目前学界对认知计算的定义因不同的视角而存在差异, 但认知计算具有的辅助、理解、决策、洞察与发现功能还是得到了公认。 在图书情报学领域,情报分析、资源组织等工作如信息组织、知识咨询、智能检索从一出现就以人的逻辑思维去探索对信息、 知识乃至数据的管理与应用,可以说认知计算早被引用到了图书情报领域。 2002 年,正式提出了“认知情报学”这一独立概念的第一届认知情报学国际会议在美国召开,则标志着认知计算与图书情报学真正走到了一起。
作为一个主要对计算机科学、情报学、认知科学和智能科学进行跨学科研究的多学科交叉研究领域,自认知情报学提出以来便受到了图书情报学界的关注。 认知情报学国际会议自2002 年召开以来已召开了17 届, 国际学者对认知情报学的研究也从认知情报学的基础理论发展到了面向大数据应用的语义化处理、自动推理等领域。 在国内,索传军、冷伏海、庞娜、孙坦等学者也开展了认知情报学研究。
2.3 从应用场景到解决方案:认知计算为图书情报学发展提供了增长点
在2017 年年初IBM 内部分享的一份趋势报告《AI/Cognitive Computing Trend Report,2017》中,IBM认为, 我们已经来到了认知计算这一计算科学新纪元时代,认知计算作为一个变革型的技术,将助推机器与人类之间的互动方式发生彻底转变, 并显著提高机器的价值。 有学者认为认知计算未来的主要应用领域为语言理解、互联网搜索、认知数据挖掘和人机交互。 很显然,图书情报学与这四个领域有着紧密的关系和联系。从更宽泛的视角来看,认知计算将对图书情报学的科学理论、 应用研究及未来发展产生重要的影响, 因此可以预计在数据密集型第四范式环境下, 认知计算将为图书情报学提供了从信息组织、数据挖掘到场景应用的诸多研究、应用增长点。如在信息检索、知识发现、信息组织等方面,借鉴于人类思维逻辑的认知计算可以有效支持智能问答、无人服务,并借助于对情景感知来获取人类信息行为大数据, 实现人机交互模式下用户认知意图精准刻画和机器自动问答, 覆盖从信息采集、 意图精炼、问题完善、语料获取、深度洞察到探索式分析的认知计算完整迭代过程。
基于上述认识与分析, 笔者认为认知计算将继续依赖其在感知、 理解和行动三个方面具有的技术优势, 在图书情报学的知识表达等场景中得到应用及研究,并提供新的或完善的已有的解决方案(具体见表2)。
3 结语
认知计算正成为新一代计算中不可获取的一部分, 但由于整个社会及科技还处于计算新时代的前期, 大众对认知计算的理解及研究应用尚不足以让认知科学得到足够的价值与应用展现。 认知情报学作为认知计算与图书情报学的研究交叉领域,自21世纪初提出以来就引起了学者的关注, 但总体而言研究成果还不丰富, 研究内容也还不足以支撑与构筑起这一交叉领域丰富的内涵及外延。 本文在概述相关概念、研究进展的基础上,对认知计算在图书情报领域未来的研究及应用场景进行了探索。 在此需要强调的是,尽管认知计算具有自我增值、协助用户的能力, 以及由静态系统转向动态系统的能力都在图书情报领域具有相当大的吸引力, 但图书情报领域对认知计算的研究要以服务应用为导向, 理解认知计算即服务这一基本定位, 让认知计算推动图书情报学精细化、智能化、智慧化发展。
表2 认知计算在图书情报学的应用/研究场景[14]