APP下载

从“互联网+”到“人工智能+”:不断升级的图书馆发展引擎

2018-03-12苏云

图书与情报 2017年6期
关键词:自然语言处理机器学习图书馆

摘 要:“互联网+”改变了生产关系、升级了传统行业生产、推动了跨界融合与创新,而“人工智能+”则颠覆了社会生产方式与思维认知,并驱动着社会向智能化、智慧化方向发展,是诸多行业发展的新引擎。文章在概述“互联网+”“人工智能+”“人工智能+图书馆”的基础上,设计了“人工智能+图书馆”的三层结构模型。分析认为,“人工智能+图书馆”有虚拟助理、虚拟服务、精准化管理等8个应用场景,“人工智能+图书馆”建设也面临着理念、大数据建设基础薄弱等障碍。

关键词:互联网+;人工智能+;人工智能+图书馆;机器学习;自然语言处理

中图分类号:TP18;G250.7 文献标识码:A DOI:10.11968/tsyqb.1003-6938.2017113

Abstract Internet+ has changed relations of production, upgraded traditional industries, and promoted creation and cross-border integration. Now the artificial intelligence+ is, as a new engine, subverting social production methods and the way of thinking, and driving society to intelligent and smart direction. A three level model of intelligence+ library is constructed by the author and it is believed that precise management,virtual assistance and virtual service can be realized in the new library, but many problems are to be solved before its realization.

Key words internet+; artificial intelligence+; artificial intelligence+ library; machine learning; processing of natural language

1956年,“達特茅斯人工智能夏季研究项目”(Dartmouth Summer Research Project on Artificial Intelligence)研讨会首次提出了“人工智能”(Artficial Intelligence,AI)这一术语,发展至今,随着AlphaGo的人机大战获胜而广为大众熟知。AI在诸多领域如医疗、交通等方面的成功应用,以百度、阿里巴巴、腾讯为首的互联网巨头公司在AI领域的布局,以及包括我国政府在内的多国将其上升到国家科技发展战略,均标示着AI时代的即将到来。作为新工业革命基础的AI,在驱动产业升级、推动技术创新展现出的绝对竞争力,也让AI为我国的新一轮社会发展和供给侧改革提供了一个弯道超车的机会。毫无疑问,诸如工业4.0、智能家居、无人驾驶、智能监控、智能医疗等呈现的“人工智能+应用场景”发展形态,正在改变我们的生活、工作、学习环境,也在改变着我们的生活、工作、学习模式。通过“互联网+”(先进社会生产关系)向“人工智能+”(先进社会生产力)的引擎过渡及“人工智能+互联网”的有效实施,变革即将到来的AI时代的社会生产方式,已成为包括图书馆界在内的行业发展共识。

1 “互联网+”和“AI+”

1.1 “互联网+”与“互联网+”行动计划

众所周知,“互联网+”概念在我国的提出源于2015年初李克强总理所做的《政府工作报告》,而“互联网+”产生的背景,则是21世纪以来以“云物移大智”(云计算、物联网、移动互联网、大数据和智能化)为代表的新一代信息技术的迅猛发展,进而驱动的产业价值链体系重构和互联网潜力的进一步释放[1]。世界主要发达国家基于积极应对互联网发展带来的变革挑战和对信息技术应用模式的创新需求,也相继出台了一系列行动计划和战略,如美国的《先进制造业伙伴计划》及《网络空间国际战略》、英国的《信息经济战略2013》等,我国也将“互联网+”行动计划上升至国家战略。自2015年7月4日《国务院关于积极推进“互联网+”行动的指导意见》(国发〔2015〕40号)出台以来,截至2017年12月1日,仅国务院发布的有关“互联网+”行动计划的指导意见、工作通知就达7项,这在充分说明“互联网+”行动计划是我国新时期的发展战略的同时,也说明我国正积极、深入地推进“互联网+”行动计划,并逐一落实和向《国务院关于积极推进“互联网+”行动的指导意见》中所提出的“到2018年,互联网与经济社会各领域的融合发展进一步深化,基于互联网的新业态成为新的经济增长动力,互联网支撑大众创业、万众创新的作用进一步增强,互联网成为提供公共服务的重要手段,网络经济与实体经济协同互动的发展格局基本形成”“到2025年,网络化、智能化、服务化、协同化的“互联网+”产业生态体系基本完善,‘互联网+新经济形态初步形成,‘互联网+成为经济社会创新发展的重要驱动力量”[2]战略目标迈进。国家战略的政策覆盖与全社会“互联网+”思维的日益普及和应用,也推动着“互联网+”日益成为支撑社会各行各业发展的基础设施之一,为此我们也看到了“互联网+交通”“互联网+金融”“互联网+教育”等传统行业与互联网的融合发展欣欣向荣之新业态。

1.2 “人工智能+” 与“人工智能+场景应用”

大规模并行计算、大数据、深度学习算法和人脑芯片这四大催化剂的发展,以及计算成本的降低,使得AI在其概念提出的六十年后迎来了一个发展爆发期,典型AI已应用在了自然语言处理(包括语音和语义识别、自动翻译等)、计算机视觉(如图像识别)、知识表示、自动推理(包括规划和决策)、机器学习和机器人学等方面[3],实践应用如AlphaGo、无人汽车、微软语音助手小冰、阿里智能家具等。与“互联网+”类似的是,随着2017年7月20日国务院印发了《新一代AI发展规划》标志着AI同样上升到了国家战略以来,党的十九大也提出要“加快发展先进制造业,推动互联网、大数据、AI和实体经济深度融合”[4],可见以深度学习为代表的AI技术无疑是新时期驱动社会发展的重要引擎。与《新一代AI发展规划》所制定的“到2030年AI核心产业规模超过1万亿元,带动10万亿产业规模”[5]战略目标相比较的一组数据则是:2016年我国的体育产业规模为1.7万亿元[6];2016年我国的高新技术(主要包括电子及通信设备制造业、生物工程、新材料等领域)产业规模为15.24万亿元[7];上半年中国电子商务交易规模为10.5万亿元,网络零售市场交易规模2.3万亿元[8]。据此可以看出AI对于产业结构调整等所带来的巨大价值。与“互联网+”主要助推我国制造业转型升级不同的是,AI通过场景应用可以改变和提升任何一个行业,其不仅能改变传统行业、创造新的品类,也能激发新的需求[9]。如“AI+医疗”所变革的是从基于医生经验医学到循证医学(统计学+小样本数据)的阶段再进一步进化到基于大数据以及AI的个性化诊疗。endprint

1.3 从“互联网+”到“人工智能+”

2015年,李克强总理的报告倡导提出了“互联网+”,两年后的十九大报告又提出将AI上升为国家战略,由此可见,在技术和需求的双重驱动下国家战略发生了改变,从相对更加强调基于互联网广泛、实时连接的“互联网+”,向更加强调数据分析、深度计算的“人工智能+”方向发展和转移。如科大讯飞等一批AI公司“人工智能+”产品的多领域成功应用,说明“人工智能+”产品具有的应用普适性及竞争性,也就不难理解业界专家如工程院院士李伯虎认为“互联网+大数据+人工智能+”时代正在到来。通过中国互联网大会、全球机器智能峰会(GMIS)、中国(深圳)IT领袖峰会等重量级IT会议的IT巨头讨论主题及AI的应用展示,就可窥见一斑。从国家层面来看,为落实《关于积极推进“互联网+”行动的指导意见》,加快AI产业发展,国家发改委、科技部、工业和信息化部、中央网信办于2016年5月18日印发了《“互联网+”AI三年行动实施方案》(国发〔2015〕40号),明确提出“到2018年,将打造出AI基础资源与创新平台,并基本建立AI产业体系、创新服务体系等;在重点领域将培育若干全球领先的AI骨干企业,初步建成基础坚实、创新活跃的AI产业生态,形成千亿级的AI市场应用规模”[10]。综上,从应用实践、发展态势及国家战略来看,AI时代即将来临,并在“互利网+”升级传统行业生产、推动跨界融合与创新的基础上,“人工智能+”将进一步推動社会生产方式实现智能化、智慧化,并将颠覆原有的生产关系及思维认知。

2 “人工智能+”与图书馆

缘何AI能如此占据市场并成为驱动社会快速发展的下一个风口?除了能让AI技术落地的大数据支撑和社会运算、深度学习等技术的突破,最大的驱动就是用户基于大数据挖掘计算的实现个性化服务的潜在需求日益强烈。对图书馆来说,其用户读者的需求就是图书馆积极迎接AI时代的最大驱动因素。那么,找准AI时代图书馆的定位和角色,进而在这一定位认知基础上构建“AI+图书馆”应用框架,寻求AI时代图书馆的发展和服务增长点,在AI时代来临之际就显得非常必要和重要。

2.1 人工智能应用的三层结构模型

从AI的应用结构和产业发展来看,AI应用的架构模型主要包括基础支撑层、技术驱动层和场景应用层(见图1)。其中,基础层以硬件和数据为核心,通过云计算提供专业化、加速化的运算能力,以及通过框架平台支撑并行计算、深度学习需求是关键;技术层专注通用平台,以算法、技术、模型为关键,即通过依托基础层的运算平台和数据资源进行海量识别训练和机器学习建模,以及开发面向不同领域、包含感知智能(如语音识别、图像识别、自然语音处理和生物识别等)和认知智能(如机器学习、预测类API和AI平台等)两个阶段的应用技术,在此基础上通过掌握“看”与“听”的基础性信息输入与处理能力,向用户层面演变出更多的应用型产品;应用层主要是AI与传统产业/行业/领域进行深度融合,最终提供消费级终端应用(如智能咨询、客服机器人等)或行业场景应用(如无人驾驶、机器翻译、智慧医疗、智慧教育等)。

2.2 “人工智能+图书馆”应用框架设计与构建

参照AI产业结构三层模型,本文构建了“AI+图书馆”应用框架(见图2)。在该框架下,包括GPU/FPGA等用于性能加速的硬件、神经网络芯片、传感器与中间件,以及云计算平台构成了支撑AI在图书馆多领域应用的硬件基础前提。但来自于行为数据抓取设施,如监控、摄像头,传统结构化数据来源,如文献数据库、书目数据库,以及主要用于挖掘分析的科学数据、网络数据等异构数据,则是AI应用于图书馆的数据基础,也是技术层感知分析,如机器学习(主要包括深度学习、对抗学习、强化学习、迁移学习)的对象和基础;在技术层,感知智能阶段通过传感器、搜索引擎和人机交互等实现人与信息的连接,获得建模所需的数据,如语音识别、图像识别、自然语音处理和生物识别等;认知智能阶段对获取的数据进行建模运算,利用深度学习等类人脑的思考功能得出结果,如机器学习、预测类 API 和AI平台等[11]。在应用层,智能机器人(如已经在较多图书馆应用于图书整理、聊天及“迎宾”的机器人)与智能硬件是“人工智能+图书馆”应用层消费级终端的两大服务、产品输出方向,场景应用则主要是对接各类外部行业的AI应用场景,如图书馆虚拟助理、图书文献分类等。

2.3 “人工智能+图书馆”的应用场景

机器人在图书整理、导航咨询等图书馆诸多服务领域的应用,及智能芯片RFID等智能硬件在图书馆硬件建设领域的应用,为图书馆的AI消费级终端应用和场景应用积累了经验,图书馆对技术的快速接受及灵活应用,也为不断发展的AI技术在图书馆应用提供了广阔空间。本文通过借鉴已有的AI图书馆典型应用,如上海图书馆的“图小灵”,以及AI在社会广泛应用的语音搜索、远程认知、个性化内容推荐、门店精细化管理等场景[12],认为AI于图书馆应用场景而言,主要分布于图书馆的事业管理、用户精准服务、资源自动化建设三个方面。具体来说,AI在图书馆的应用场景主要有虚拟助理、文献分类等(见表1)。

2.4 “人工智能+图书馆”发展面临的问题

早在2016年AlphaGo因人机大战获胜而广为大众熟知、大众众对AI热捧之时,英国的《新科学家》周刊网站就刊发文章,对AlphaGo的获胜是不是表示机器即将获得类人智能表示了怀疑。AI在智能设备、GPU/FPGA、超级芯片、中间件等硬件设备发展的支撑,以及机器学习、自然语言处理等技术的驱动下,确实已在医疗、教育、零售等领域展现出了发展潜力。然而,我们也应该看到AI还处于寒武纪的大爆发与弱AI应用阶段,还未达到通用智能、强人工智能应用阶段。

伴随着互联网的高速发展和底层技术的不断进步,以及国际互联网巨头纷纷布局AI,AI重构人类生活的数据量、深度学习算法、高性能计算、基础设施成本都正在趋向完善,但AI仍然面临着理论鸿沟问题、知识表达问题、人才问题、资本化问题与安全问题五大考验。其中,关于理论鸿沟问题,目前AI在学习上遵循的理论依然是上20世纪80年代提出的,人们并没有从本质上理解人类的学习原理,从监督学习到无监督学习的方法还在探索;关于知识表达问题,正如海云数据的首席数据科学家赵丹所言,“目前大公司基本上通过知识图谱来解决知识表达的问题,但这不是根本的解决方法;深度学习的研究一定程度上已经到达瓶颈期,现在到了需要将深度学习现有的成果转化成产品的时候”[13];关于人才问题,根据智联招聘《2017AI就业市场供需与发展研究报告》显示,2017年AI人才需求增长近2倍,企业在追逐人才时出现高薪难求的状况[14];关于资本化问题,目前AI还是巨头公司的天下,所以被并购是许多初创公司的宿命。同时,谷歌等互联网科技巨头间的竞争布局,也正在引发一场全球范围内的AI投资收购热潮;关于安全问题,不少人信任和支持的摩尔定律、奇点理论、AI毁灭人类论等过度担忧AI的思维或观点,也在一定程度上阻碍着AI的实际进步。于图书馆而言,AI的应用除了上述五大考验外,图书馆界目前缺乏AI思维理念,相对薄弱的AI基础建设,尚未得到重视和应用的AI技术与平台,缺乏与AI相匹配的政策、标准、规范、制度等,也都对AI在图书馆快速应用造成障碍。特别是AI基础设施建设中的大数据建设,由于当前图书馆对来自于智能终端设备的半结构化数据、非结构化数据收集与管理还处于探索阶段,对基于这些异构数据的用户画像分析及应用服务都属于空白,可以说,大数据建设的滞后从基础上就限制了AI在图书馆的快速发展与应用。endprint

3 结语

“互联网+”的出现和发展,改革了社会生产关系,但在连接、交互、计算的推动下,“人工智能+”也已来到我们的身边。AI对于各行业各领域的赋能,在生产环节表现为生产效率的提升和生产成本的降低;在赋能效果方面表现为传统行业的升级、新兴行业的出现,最终导致相关产业链的整体变化。然而,目前AI应用既存在着人的思维难以描述与模仿、无法保证AI技术合乎道德应用等一时难以攻克的难题,也存在着诸如理论鸿沟、人才困境等普适性问题和机器学习算法存在局限、人机交互的用户体验不够等技术性问题。对图书馆来说,其公益性、公共性和教育中心等组织社会属性,以及在大数据建设方面的滞后,更是在一定程度上放大了AI应用在图书馆存在的相关问题,也需要我们图书馆从业者及研究者更加深入地探究。

参考文献:

[1] 宁家骏.“互联网+”行动计划的实施背景、内涵 及主要内容[J].电子政务,2015(6):32-38.

[2] 国务院关于积极推进“互联网+”行动的指导意见[EB/OL].[2017-10-18].http://www.gov.cn/zhengce/content/2015-07/04/content_10002.htm.

[3] 人工智能现在的发展前景如何?[EB/OL].[2017-10-18].https://www.zhihu.com/question/20102212.

[4] 推动互联网与实体经济深度融合[EB/OL].[2017-10-18].http://news.xinhuanet.com/2017-12/09/c_1122083907.htm.

[5] 赵青晖.重磅 | 国务院新一代人工智能战略:2030年带动10万亿产业规模[EB/OL].[2017-10-18].https://www.leiphone.com/news/201707/gzFZqkEfntzNAvSq.html.

[6] 2016年我国体育产业总规模已经达到1.7万亿元[EB/OL].[2017-10-18].http://www.sohu.com/a/122825597_115239.

[7] 邹长森.中国创新力惊艳世界 高技术产业规模超15万亿[N/OL].[2017-10-18].http://tech.southcn.com/t/2017-02/24/content_165827436.htm.

[8] 中國电子商务研究中心.2016年(上)中国电子商务市场数据监测报告[EB/OL].[2017-10-18].http://www.100ec.cn/zt/upload_data/B2B/EC.pdf.

[9] 任翀.2020年,中国这个产业的规模能达到10万亿级![EB/OL].[2017-10-18].http://web.shobserver.com/news/detail?id=70393.

[10] 中华人民共和国发展和改革委员会.“互联网+”人工智能三年行动实施方案[EB/OL].[2017-10-18].http://www.ndrc.gov.cn/zcfb/zcfbtz/201605/t20160523_804293.html.

[11] 人工智能热背后的产业链布局分析[EB/OL].[2017-10-18].http://www.sohu.com/a/197384863_104110.

[12] 你想实现的AI场景[EB/OL].[2017-10-18].https://ai.baidu.com/scenarios.

[13] 2016年人工智能领域的总结与思考:未来将面临的五大考验[R/OL].[2017-12-18].http://www.iheima.com/zixun/2016/1230/160609.shtml.

[14] 智联招聘.2017人工智能就业市场供需与发展研究报告[R/OL].[2017-12-18].http://www.sohu.com/a/210275820_102681.

作者简介:苏云(1963-),男,兰州大学管理学院教授,研究方向:社区治理、知识管理。endprint

猜你喜欢

自然语言处理机器学习图书馆
图书馆
基于组合分类算法的源代码注释质量评估方法
基于网络搜索数据的平遥旅游客流量预测分析
前缀字母为特征在维吾尔语文本情感分类中的研究
基于支持向量机的金融数据分析研究
面向机器人导航的汉语路径自然语言组块分析方法研究
汉哈机器翻译中的文字转换技术研究
HowNet在自然语言处理领域的研究现状与分析
去图书馆