基于深度学习的智慧图书馆智能信息服务系统研究

2019-04-13李建伟

图书馆学刊 2019年1期

李建伟

（嘉应学院图书馆，广东梅州 514045）

1 图书馆信息服务发展现状

信息服务是图书馆的一项核心业务工作，是图书馆开展学科知识服务的重要工具，是专业馆员与读者知识交流沟通的重要“桥梁”。遵循传统信息咨询服务模式的图书馆，咨询馆员能否为读者提供深度的知识咨询服务，往往取决于自己是否具备足够宽的知识面以及良好的沟通交流能力。因不同咨询馆员各自知识结构、素养以及业务技能水平不一，所以往往会造成咨询服务质量参差不齐或咨询表面化等问题。在传统咨询信息分析环节过程中，读者更多地依赖咨询专家主观的业内经验，面对日趋复杂的咨询情境，也容易陷入咨询效果偏离现实要求的困境[1]。

近年来，“互联网+”的快速发展悄然改变了信息服务的传统方式，互联网问答社区日益兴起，问答社区以知识与经验共享为目的，参与者可以关注感兴趣的话题，可以提问寻求帮助，其他用户则可以根据自身的知识、见解在线给予解答。社区平台还通过提问、回答、评论等互动来激发读者的知识分享行为，以多元化的奖励方式积极邀请其他读者来参与，目前比较盛行的问答平台有Quora、Stack Overflow、知乎等。另外智能问答系统也逐渐走入互联网用户日常生活，如Google Now 会全面了解人们的各种习惯和正在进行的动作来为其提供相关信息，苹果公司Siri手机语音助手，微软小冰也正在被大家广泛使用。

面对时代的挑战，为提升信息咨询的实时与便捷性，图书馆正积极开发分布式虚拟信息咨询系统，一体化的咨询平台可以充分发挥学科馆员的智力劳动，为用户提供集实时咨询与延时咨询于一体提供深层次、多应用场景灵活切换的服务，以弥补传统模式下延时咨询方式的不足。区别于传统咨询的“接受服务”，部分图书馆构建虚拟知识平台，通过解答问题创造知识，通过用户互相探讨提供知识服务。咨询馆员的主要角色则由负责回答用户问题转换为审核读者提交的问题或答案，适时有针对性地将恰当的内容推送给用户，或者邀请其他用户、专家协助解答。另外，馆员承担把馆员和用户的隐性知识转化为显性知识的任务，将问题答案累积到知识库中，为读者未来的学习研究提供参考。同时智能机器人馆员也开始上岗，如上海图书馆引进的机器人“图小灵”，当它被培训“学习”到知识后，可以像一名资深图书馆员一样，为读者提供信息咨询服务。服务创新是图书馆信息咨询业务形成核心竞争力的唯一途径，传统图书馆咨询服务正逐步迈向新一代的智慧服务模式。

2 人工智能时代智慧图书馆的知识咨询服务

2.1 智慧图书馆知识咨询服务的发展环境

自2009年IBM提出“智慧地球”概念以来，伴随着大数据、云计算、物联网和人工智能等技术的快速发展，智慧图书馆及其服务体系已经成为图书馆界研究的热门课题[2]。近年来，人工智能在知识表示、语音识别、语义识别、计算机视觉等领域取得一次又一次突破，在图书馆的知识咨询服务领域也催生了越来越多的信息服务“智慧”应用。大数据与云计算是人工智能发展的基础，三者的融合已经深刻影响了各行各业的革新式发展。机器智能系统要拥有类似人类的智能理解事物问题的能力，很大程度上依赖于是否拥有庞大的数据量，是否拥有强大计算分析能力的处理器以及快速的网络传输速度。传统互联网到移动互联网的发展，设备互联，人机互联，信息大量涌现且无处不在，衍生出了大数据时代。大数据处理需具备执行大规模并行计算能力的处理器，当前远超CPU 并行计算能力的GPU处理器的出现，使得大数据处理变得可能。5G网络时代的到来，更加全面地释放人工智能的潜能，有力地推动了整个网络实现智能化。面对人工智能、机器学习和数据挖掘等技术异军突起，现代图书馆也在探索运用人工智能理论与技术让机器“听懂”“读懂”“看懂”用户的资源需求，为用户提供自动、主动、精准的知识咨询服务。

2.2 基于人机交互的“AI+”信息咨询发展范式

智慧图书馆以数字化、网络化、智能化的信息技术为基础，以互联、高效、便利为主要特征[3]。现代图书馆与读者的人机交互方式，不再局限于传统的鼠标和键盘结合的用户界面，而是倾向于更加符合人类习惯的不受时空限制的语音交互。用户利用人工智能的“认知”技术，通过语音和拍摄图片的方式向咨询“机器人”发出指令。“机器人”依次完成图像识别、用户语音识别、内容语义分析后，可以准确获取用户需求，通过语音合成模拟自然人进行结果反馈，用户在聆听机器语音回答时就像与专业馆员对话一样，同步性更强。语音问答既可以帮助咨询馆员更好理解用户所表达的知识问题，也可以有效感知用户所传递的隐性信息，包括说话语气、态度和情绪等，使得读者与咨询馆员之间的知识互动和信息交流传播富有情感和感染力。当然，现存人机交互技术也存在不少障碍，如语音识别无法准确识别地方方言；语音合成技术在音色、语速和语种等方面的合成上存在不小的缺陷；语义理解技术法难于做到全部理解，因为词语有歧义，句法有模糊，语义背后隐含的情感难以理解。然而，运用人工智能技术实现自助式信息咨询服务，可以让读者拥有更多更精细的回答，获得更全面更快捷的咨询服务体验。

2.3 以大数据驱动的智能信息服务生态

信息服务平台中咨询馆员与读者的知识交流容易产生有价值的交互数据，包括原始创作的各类视频、声音、图片、文字等信息内容。人工智能是和大数据联系在一起的，拥有“聪明算法”的网络机器人，可以采集自动抓取实时交流更新的信息，用户的任何一个阅读行为将被如实记录，如点击次数、内容阅读时长、读者评论、转发或分享动作等。智能系统对这些交互数据进行数据清洗、筛选、挖掘、分析，语义理解用户提问，大数据分析用户的阅读兴趣，描绘一个用户的兴趣图谱，然后针对用户的兴趣来智能遴选信息，选择在合适的应用场景让最匹配的知识信息和目标用户耦合。最后启动语音自动回答，真正体现智能知识咨询的“信息通路”功能。以大数据为基础，以人工智能为核心，以提供个性、精准、高效的信息服务为目标，新一代智能知识咨询服务形成的是以大数据驱动的标准化、专业化的知识咨询服务闭环生态，如图1所示。

图1 智慧信息咨询服务闭环生态

在智慧信息服务生态中，系统人员预先为知识问答建模，经过成熟模型训练，保存稳定的模型。当用户发起信息请求时，平台经过无监督式自我深度学习准确预测结果，向用户主动推送，让咨询馆员从一些简单、重复的工作中解放出来。利用海量历史数据来关联计算读者关注某一话题的信息强度，如果信息强度超过阈值，图书馆智能知识咨询系统会自动向读者推送预期信息资讯，解决人工难以完成的有效的个性化推荐的问题，也为读者节省了信息过滤的时间。资深馆员的智慧和经验则主要运用于如何确定人工智能在信息咨询服务中的使用场景，如何抽查审核内容，如何修正技术差错以确保内容安全，从某种意义上说，智能知识咨询是人工智能与专业馆员共同努力的结果。

3 基于深度学习的智能信息咨询自动问答系统

3.1 机器学习与深度学习

人类拥有的一项高级智能行为是自我学习，能否让机器像人类一样可以利用不断积累经验自动改善自身效能，不断生产出更多新的知识呢？机器学习正是让机器具备人类智能必要的最重要的技术，使它学习数据中的内在规律性信息，获得新的经验和知识，能够像人那样去决策。当前机器学习在社会领域的应用研究已经取得了重要进展，一些重复、数量庞杂却简单的工作完全可以由机器学习的方式来替代，以减轻人的负担。深度学习则是近年来机器学习的新的研究方向，它模拟人脑的多分层结构、神经元的连接交互、信息的逐层分析处理等机制，使机器模仿视听和思考等人类活动，自适应、自学习能力强大，被称为最接近人类大脑的智能学习方法和认知过程[4]。

3.2 人工智能知识咨询自动问答系统模型原理

随着大数据时代的到来，深度学习技术在语音识别、搜索推荐、自然语言处理等领域应用前景广阔，图书馆也逐渐融入深度学习构建智慧知识自动问答平台开展虚拟咨询服务。首先智能咨询系统源源不断将数据传到云端，利用人工智能的算法对这些数据进行比对，应用“语音识别”将用户产生的录音内容自动转化为相应的文本或命令。云计算的出现使集中化数据计算处理能力变得空前强大，机器利用深度学习技术进行语义识别，完成内容理解和价值判断或转换为命令，基于大数据的“咨询大脑”会将新出现的内容与已有数据进行关联技术计算，准确理解语义进行检索，最后将输出结果转换成机器合成的语音，以对话的形式将结果反馈给用户，见图2。对于没有事先定义的输入问句，对咨询馆员而言是困难的，但对机器来说其实只要符合一定的规则，问答系统可以从一系列可能的回答中选出一个与问句最相关的答句，给读者感觉像是在和人问答而非与机器问答。

图2 自动知识问答服务框架

区别于基于知识数据库检索的传统咨询方法，基于深度学习算法的端到端的问答系统，有机组织语音识别、语义理解和语音合成等重要人工智能技术实现自动问答的功能，主动提供与问题相关联的主题知识。智能知识咨询融入深度学习，从海量的低层交互数据中自动地提取多层特征表示，由具体到抽象、由一般到特定，从简单特征中提取更加复杂的特征，目标是让机器不仅仅能够识别读者提交的文字、图像和声音等数据，还要能够像人一样具有分析学习能力，能够并使用这些组合特征去帮助读者回答问题。

3.3 基于深度学习的智能信息咨询自动问答系统关键构建技术

3.3.1 自动问答系统神经网络学习与模型训练

基于深度学习的自动问答系统学习模型模拟人脑的学习能力，依赖于含有多隐层的神经网络，神经网络隐层节点一般超过5 层，有时多达10 层。学习模型首先让各层预先学习来自数据源的知识特征，再经过神经网络学习层的学习推理，生产出预先没有发现的有价值的一系列知识规则。神经网络学习层的学习从浅层顺次开始，由浅层的初级特征逐步学习到深层的高级特征，上一层学习得出输出数据会作为下一层的输入数据，最后将初始样本数据从原有特征空间转换为一个全新的特征空间来表示，建立起对输入问题和输出答案之间的联合分布，达到对大规模语料数据特征学习的目的，可以使咨询问题分类或自动预测问题答案更加容易实现，提高精度，如图3。学习模型强调知识反馈学习，采用参数权值赋予的形式更有效地控制学习算法的可变因素，以便更主动地适应新、老用户人机之间的学习差异。

图3 智能知识咨询平台神经网络学习模型

智能信息咨询系统学习能力的培养与人类相似，需要教材和预先训练，基于规则先构造小型语料分类器进行数据处理，目的是用机器学习方法训练出一个准确率比较可观的模型，然后作为更大规模数据集的数据处理器。训练数据获取渠道、途径和来源、用户在线浏览信息的行为、咨询馆员与用户交互产生的信息、用户生产的内容信息等也成为训练集的重要来源。由于面向专业知识领域的特定主题的语料获取、整理比较困难，可以通过发放问卷的形式或引导读者填写关于指令类语句等形式有偿回收用户的反馈，通过人工编辑构成质量较高的具有相应主题的语料。语料库的主题设置可以围绕图书馆读者服务项目进行有针对性的层级设置，如设置学科服务、馆际互借、书刊借阅、读者培训、电子资源获取、规章制度、意见建议等常见一级主题问题，每一个子主题设置数量充足的问题语句，每个咨询问题一般归属一个类目，内容特征相似的问题最多可以归属2～3个类目。

3.3.2 智能信息咨询服务自然语言处理

机器无法直接理解人类的语言，如何将咨询平台用户的输入划分到相应的主题中去，是实现自动问答系统的关键技术。自然语言处理是人工智能领域研究的重要方向，为让机器可以运用学习算法来处理自然语言，通常采用词向量的方法将语言数学化，譬如经典的词向量，表示方法one-hot representation是采用将所有的单词标号后建立一个词表长度大小维度的向量，然后组成一个句子的方法，如将词语表示成x={0，0，0，0，1，0，…，0，0，0，…}的形式，这个向量的每一个维度代表一个词语，如果这个句子中有该词语，那么将这个位置置为1，其他维度置为0。假若我们想要表示一个包含10个词的句子，如果用20 维的词向量来表示，我们将会得到一个10*20的矩阵作为模型训练的输入。矩阵的每一行代表一个经过分词后的单词元素，即一个单词的向量表示。但one-hot 这种表示无法表示出在语义层面上词与词之间的相关信息，仅仅将词符号化，而且向量的维度会随着句子的词的数量类型增大而增大。

Google 2013年推出的融合深度学习的思想开源工具包word2vec（也叫Word Embeddings），能够将自然语言中的字词转为计算机可以理解的稠密向量（Dense Vector），有效实现词向量简单高效获取。对于咨询平台的用户输入的句子的表示，自然语言处理任务主要将所有的训练数据的每个单词向量化成一种数值表示，通过词向量的方法将词映射到一个矢量表示空间。利用Word2vec 的词向量表示方法对语料进行训练，不仅可以把文本处理为可控制维度的向量空间，而且能够更有效地描述问题语句中词语间的相关性，词义相似的词将被映射到向量空间中相近的位置。

为了更好、更方便、更高效地使用机器学习算法，通常需要一定的软件平台支持，不可忽视的是近年来科技巨头纷纷开发深度学习框架，如CNTK、Caffe、TensorFlow等，这为图书馆大大降低了开发深度学习系统应用的门槛，为智慧咨询自然语言处理提供了强有力的支持。尤其是TensorFlow作为谷歌发布的新一代机器学习平台，它支持最流行的包括CNN、RNN、LSTM算法在内的深度神经网络模型，支持C++、Python等开发语言，并能够进行网络分布式学习，利用word2vec 功能应用实现字母向量化，在自然语言理解领域可以得到良好的应用。

3.3.3 卷积神经网络在主动信息推荐的应用

智慧咨询平台的主动信息推荐基本流程是通过语料分析，对用户兴趣行为的深度挖掘，过滤掉与其感兴趣信息不匹配的信息，对学科属性比较相近的提问进行关联计算，形成用户关注度较高的同类话题的图谱，生成个性化信息推荐模型以满足用户差异化信息获取需求。对于语料数据集如何选用最合适的网络结构，对不断更新的数据集都具备比较精确的主动分类性能，是主动问答系统一个研究关键点。机器学习算法主要用来求解问题，寻求最优化步骤和过程。近年来，各种新的深度学习算法模型也不断被提出，如卷积神经网络（Convolutional Neural Network，CNN）、循环神经网络（Recurrent Neural Network，RNN）和长短期记忆网络（Long Short-Term Memory，LSTM）等。

CNN 是一种含卷积层的比较成熟且应用广泛的前馈神经网络，其网络结构更接近于实际的生物神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单元，对于大规模的信息知识分类模式识别都有着非常好的性能表现。

在深度神经网络模型CNN中，卷积定义为：

s（i，j）=（X∗W）（i，j）=∑m∑nx（i+m，j+n）w（m，n）

其中，W称为卷积核，而X为输入；如果X是多维输入的张量，那么W也是一个多维的张量。例如图4，输入X是一个二维的3×4矩阵，卷积核W是一个2×2的矩阵。假设卷积以一次移动一个像素来卷积的，那么左上角2×2 局部和卷积核卷积的输出矩阵S 的S00的元素，值为aw+bx+ey+fz，即各个位置的元素相乘再相加。接着输入的局部向右平移一个像素，同样的方法，变成（b，c，f，g）4个元素构成的矩阵和卷积核来卷积，可以得到输出矩阵S 的S02，S10，S11，S12的元素。通过卷积层处理过的节点矩阵会变得更深，能够有效地避免传统机器学习方法所面临的样本特征表达稀疏、计算复杂等问题。

图4 二维的3x4的卷积矩阵

CNN 在计算机视觉、声音识别、人脸识别等领域取得了很大的成功。不少学者把它应用于自然语言处理领域，并对该网络进行了改进，特别是在知识问答分类处理应用领域表现出色。如文献[5]研究了CNN 在文本分类的实际应用，实验证明基于CNN 文本分类模型能够获得比传统机器学习模型更高的正确率。文献[6]和[7]介绍了如何学习将句子表示成包含语义的结构，基于用户当前的阅读内容，为其推荐其他感兴趣的文档。CNN通过卷积操作，可以学习到句子中抽象的特征且组合低层特征形成更加抽象的高层特征，而且无需人工干预。通过应用卷积神经网络良好的自动学习特性，咨询平台自动分析咨询问题的内容，分析读者对知识热点的讨论，分析和研究读者的意见、情感、评价、态度和情绪等，可以挖掘和分析出大量的知识和模式，从而为主动信息推送提供科学规则。

3.3.4 自动问答“问题——答案”的主动分类

“问题——答案”主动分类在咨询平台的信息组织与管理中具有举足轻重的地位，核心方法是能够同时理解读者的需求和知识库的主题特征，要提取分类数据的特征并选择最优的特征匹配，不仅仅限于为用户提供问题答案简单检索功能，而是基于深度学习更精确地为读者进行知识提供，为读者节约更多信息筛选的时间和精力。

问答系统分类模型结构明晰，首先要进行文本预处理，主要去掉常用且意义不大的停用词，同时要利用分词算法针对中文文本进行分词处理，利用word2vec训练大量的语料得到中文词向量。经过分词的输入句子按照输入顺序逐词编码成一个由隐藏层输出定长的向量，这样一个定长的隐藏层向量可以充当输入句子的语义特征向量，其嵌入了句子中各类重要的语义信息，因此可以很有效地表征一个句子的语义。每一轮前一个词的编码结果将会作为下一轮后一个词的编码过程的输入的一部分，因此最终得到的隐藏层向量包含了整个句子的语义信息。另一个神经网络作为解码器，根据输入一个个词输出解码的结果，将这些词按序拼接后得到的就是对于用户问句的答句。在这个过程中，每一个神经网络单元的输入是上一轮解码的隐藏层向量与前N 轮解码出的单词。因此，在解码过程中的每一轮输出的结果都受到了上下文（也就是编码结果）以及之前N轮生成的单词的影响，因此系统输出的答句既能准确回答用户的问题，又具有较好的语法结构、语序合理，而且答句句式较为新颖。

加入Word2Vec 与CNN 模型的问答系统框架，对数据特征逐层地提取，将连续的低维特征信息进行高维特征抽取合成，利用高维特征样本训练深度神经网络模型，充分地体现信息数据特征间的相关性，进而得到理想问句——对答案的分类处理。因为技术算法的融入，问答系统反馈的结果不再是单条即时信息的集合，而是按事先确定的规则挖掘推送的问题答案的有序聚合，通过引导式推荐让读者沉浸于内容本身，不断地关联阅读下去，从而增加阅读深度。

4 人工智能在图书馆信息服务中的创新与未来发展

人工智能技术是新时代一项创新技术，在图书馆知识服务领域应用前景广阔。基于深度学习实现图书馆智慧咨询服务，可以改变传统咨询服务中馆员与读者之间被动的信息交流模式，替代专业馆员完成可能需要投入大量资源和时间才能完成的咨询工作，提升图书馆的服务效能以及便捷化水平。算法推荐技术属于智慧咨询系统的核心技术，依托图书馆内已有信息知识资源，可以有效洞察读者潜在资源需求，促使信息服务从主要依靠专业经验进行粗放管理向泛在化、智慧化管理转变。

当然人工智能在信息咨询服务领域还存在很多发展瓶颈。比如传统咨询模式，咨询馆员是信息的“把关人”，为用户起着价值判断、不良信息过滤的角色。然而智能推荐系统对信息的过滤主要依赖于对关键字的回避，对信息的甄选以及优劣和真假判断有待提高。另外，人与机器的语义交流网络中如何更科学地形成完备的语义体系，对抽象的概念如何实现更精确地语义识别，以及实现真正意义上的交流，也是建设智能推荐模式的难题。大数据人工智能算法只能根据用户历史记录发掘兴趣模式进行知识推送，如果机器算法不成熟完善，导致推送的内容重复度太高，可能会让用户越来越被动地倾向于接收和自己相类似的信息和观点，使他们越来越难从“信息茧房”中解放出来，越来越窄的信息环境会限制读者的视野，减少其接触其他多元化信息的机会。当然，从技术上看，以自动、主动开放为理念的人工智能信息推荐是卓有成效的，面对成千上万的文本进行处理的机器人学习过程中出现的诸多问题，我们要做的就是根据出现的异常不断修正完善，进一步提升智能化服务水平，但随着算法和模型的不断完善，这些问题都将被陆续解决。