人工智能与知识服务的个人化
2018-09-10宋建武
宋建武
摘要:在2014年8月18日中央深改组第四次会议上,习近平总书记对媒体融合提出了一个重要的指导思想,他指出“推动传统媒体和新兴媒体融合发展,要遵循新闻传播规律和新兴媒体发展规律,强化互联网思维”。
人工智能的知识服务的个人化,将会成为未来出版业互联网化的产品发展趋势。一个新的出版业的巨头将会是这样一个平台及其服务的运营者。
关键词:出版业 融合发展 互联网化 人工智能 知识服务
从2014年起,我国的新闻出版业开始面对媒体融合这一国家战略级的发展课题,从2016年开始,又面临一个如何深度融合的问题。那么媒体融合到底是什么?在什么意义上理解才对出版业有意义?从理论和实践看,对这一点需要有一个清晰的分析。
媒体融合即主流媒体的互联网化
我们对作为中国国家战略的媒体融合要有一个基本的概念、基本的判断,即媒体融合就是主流媒体的互联网化。
这一论断的依据是习近平总书记对于媒体融合问题的一系列阐述。2013年8月19日,习近平总书记在全国新闻宣传工作会议上讲话,提出了媒体融合的战略构想和战略目标,他实事求是地指出“很多人特别是年轻人基本不看主流媒体,大部分信息都从网上获取”,他要求“必须正视这个事实,加大力量投入,尽快掌握这个舆论战场上的主动权,不能被边缘化了”,“要适应社会信息化持续推进的新情况,加快传统媒体和新兴媒体融合发展,充分运用新技术新应用创新媒体传播方式,占领信息传播制高点。” 在2014年8月18日中央深改组第四次会议上,习近平总书记对媒体融合提出了一个重要的指导思想,他指出“推动传统媒体和新兴媒体融合发展,要遵循新闻传播规律和新兴媒体发展规律,强化互联网思维”。2016年2月19日,习近平总书记在党的新闻舆论工作座谈会上讲话,作出了一个重要判断,他说:“新闻媒体在融合发展方面做了大量工作,取得令人可喜的成绩,但发展还很不平衡,有的是‘+互联网,而不是‘互联网+,没有实现融合。”
从实践看,近年来国内主流媒体的很多融合尝试之所以收效不彰,没有实现“掌握这个(网络)舆论战场上的主动权”,“占领信息传播制高点”的战略目标,走弯路的原因就在于没有认真思考新兴媒体发展规律到底是什么?互联网思维又是什么?就在于在媒体融合实践中,没有把互联网化作为一个基本方向,不是在“互联网+”的基础上进行媒体融合,而是从概念到概念,各自理解,各自操作。实践中,有人甚至提出所谓传统媒体业务与新兴媒体业务“此长彼长”这样违背“融为一体,合而为一”这一正确融合方向的观点,却得到相当一部分传统媒体业内人士的认同。
既然我們判断说,出版业和新闻业的媒体融合,就是这两大产业的互联网化,就是其生产方式包括运营方式的互联网化,那么我们在面对深度融合这样新的课题时,就要更加自觉地掌握和运用新兴媒体的发展规律,掌握和运用互联网思维。
互联网应用的发展方向:平台化、移动化、智能化
要掌握和运用新兴媒体的发展规律和互联网思维,就要研究分析互联网应用当前是在向什么方向发展。关于互联网应用当前的发展趋势有多种说法,有说数据化的,有说视频化的,等等。我们认为,从本质上讲其实是三个:第一是平台化,第二是移动化,第三是智能化。这三个趋势之间是紧密相连的。
平台化有两层意义:一是各种资源、各种信息的交换与互动,是在同一个互联网应用平台上进行的。在我们的微信朋友圈里,大家是怎样进行信息的互动呢?我们怎么利用互联网应用打出租车呢?还有我们是怎么使用共享单车呢?观察分析之后,我们会发现,在这一过程中,所有的资源和相关信息,都是在同一个互联网应用平台上向所有人开放的。因为只有网络平台才能提供这样的可能性,而这样的平台充分体现了平等、互动、分享和公众的普遍参与,这才是互联网思维的本质。二是我们从外部来看,这样的网络平台,在业态上出现了多种功能、多种垂直应用在平台上的聚合。这种聚合使得大数据可以在这个平台上生成,而且不同行业的大数据之间可以出现匹配的可能性。大家其实在实践中都会发现,单一行业的大数据其实是没用的。在这里给大家分享一个若干年前的发现。当年我们帮助浙江日报报业集团做发展规划的时候,曾经专门调研过国家电网的大数据采集和应用问题。这个系统中也有很多用户数据,但这个用户数据拿来干什么呢?通俗地说,就是防止大伙偷电这一个用处。实际上我们研究发现,如果这些数据和其他功能的应用数据相匹配,会产生很多有价值的东西。所以,我们认为,数据库运营商的商业模式就是“1+1>2”,它的利益点就是在不同应用的数据库匹配的过程中产生的边际效益。从互联网的业态上看,这种平台化,使得各种垂直应用和各种用户数据实现了聚合,使得平台以及各个应用的用户黏性都得到大大的增强,这就造成了互联网超级大平台的超级垄断。这是我们不能不看到,不能不承认的一种趋势。这样一种平台,会构建起强大的数据库,具有强大的存储能力、计算能力、分析能力,才能够把大数据真正用起来。
移动化带来了参与传播过程中个人的主体化。在个人主体化的过程中,个人成为传播的主体和目的。个人可以在这个传播过程中被发现、被确认。在之前包括传统出版在内的整个大众传播过程中,这种面对特定个人的信息分发,其实是没有的。如果我们看不到移动终端、移动网络组成的移动传播体系带来的这场传播革命,我们就可能无法理解未来大数据的应用前景。移动化还带来这样一种新的变化:就是对社会成员的每个个体,他在移动互联网上进行的各种信息消费,各种活动,各种行为,比如说在手机上看了什么,GPS定位显示都到过哪里等这些数据,都会作为他所产生的大数据,上传到平台,被平台搜集,被平台储存,从而极大地丰富了平台的数据库。这个大数据平台据此对一个人的需求特点进行分析,并整合平台上的各种资源满足其需要。概括起来说,移动化能够识别到个人,使个人成为主体,能够捕捉到特定个人的需求,能够面向特定个人提供个性化服务。
移动化生成了大数据,平台化汇聚了大数据,但大数据的应用,关键还是要通过机器算法对大数据进行计算分析才能够产生价值,靠人工是无法处理真正的大数据的。比如阿尔法元,其实就是依靠超级的计算能力,把每一步棋所有可能出现的应对,以及所有可能产生的结果,在瞬间进行完整的计算。这个东西我们人类做不到。所以只有智能化才能把大数据和算法有机地结合起来,产生人工智能。在某种意义上讲,人工智能就是用算法来处理大数据。算法本质上是一种函数关系,是计算机使用的一种处理信息的规则,一种算法好不好,关键在于这个算法对于人们处理特定事务的规则的拟合度高低,因此,在本质上,可以说算法是人制定的。很多人担心,未来的人工智能会不会发展到脱离人的控制?我想除非是有意为之,否则人工智能永远不可能脱离人的控制。从这个意义上讲,我们不用担心算法自身的进化会使机器统治世界。当然,如果人类中出现一个恶魔,一个叛徒,来为机器人设计一套程序,而这套程序可以自我再继续开发,那就有可能造成一个机器人来统治的系统,这种可能性也是有的。但是整体上讲,就目前我们看到的可能而言,人工智能只会强化人的能力,目前而言就是直接提升了平台的能力,使得平台具有处理各种海量信息的空前的可能性。
人工智能的发展,如果不能商业化的话,就没有发展的动力。人工智能如果想要商业化,就目前的应用场景,首先是依托于移动传播体系的运营。就未来的发展看,移动传播体系在相当长时间内将会是人类主要的传播系统。为什么呢?就是因为这种传播体系,可以随时随地以任何手段和方式接收和传播信息。依托这个系统,我们创造了一种新的社会连接方式。讲到媒体和传播,最关键的东西是什么呢?很多人讲内容为王,但客观地说,是连接为王。连接的方式决定了我们运用内容的方式,甚至决定了我们生产内容的方式。在某种意义上讲,拥有连接能力才是媒体,只能生产内容的所谓“自媒体”,严格意义上只是内容供应商。
当前,中国移动传播体系的普及率在全世界都是领先的。数据显示,我国移动终端设备的保有量已经超过10亿,已经是全世界移动终端保有量最多的国家;据《第40次中国互联网络发展状况统计报告》,截至2017年6月,我国移动网民规模达7.24亿,占网民总数的96.3%;移动终端的互联网使用率已连续三年增长率超过10%。中国的网民总数是多少呢?据《第41次中国互联网络发展状况统计报告》,截至2017年12月,我国网民规模达7.72亿,普及率达到55.8%,超过全球平均水平(51.7%)4.1个百分点,超过亚洲平均水平(46.7%)9.1个百分点。
移动网络的发展也正在加速。国内三大移动运营商已经确定于2020年启动5G网络商用计划,建设工程将于2018年开始。另外一个不可忽视的发展,就是扎克伯格和马斯克正在合作打造一个覆盖全球的卫星宽带互联网体系。中国卫通公司也在做这样的体系开发,也在做这样的布局。所以在未来,我相信随着技术的发展,可能有一天,卫星宽带互联网会带来移动通信网络的一个很大的飞跃发展。
移动应用的普及,也是我们在世界领先的一个领域。其中主要的应用首先是即时通信,然后是视频、电商、支付、社交。属于信息服务类的有爱奇艺、腾讯视频、微博、手机百度、优酷视频、QQ浏览器、腾讯新闻等,其中视频基本上属于娱乐范畴。移动应用里面一个核心应用就是支付,这是我们在全球绝对领先的一个应用领域。对于移动传播还要注意到的是,随着移动传播体系的形成,一代新的移动接入平台在取代旧的门户网站。我给学生上课时问这些年青人,他们几乎不知道三大门户网站是什么,不知道谁是王志东这个PC门户时代的互联网英雄。这种变化其实就是互联网的迭代,就是移动带来的迭代。更不可忽视的是,移动化产生的大数据的生产力是空前的,给智能化提供了基礎条件。能够把每个个人的数据实时上传,能够发现每个个人的需求,锁定个人的需求,这就是移动化的魅力。
怎么应用这些大数据,以实现人工智能的商业化?如果不能把数据用起来,可以说我们仅仅是建设了一个数据仓库。大数据如果想要用起来,就必须去寻找新的应用场景。我们认为,面向个人需求的精准化传播将会是大数据主要的应用场景。为什么这么说?首先看看人类生产的大趋势:在工业时代,人类完成一个什么样的过程呢?是完成一个集中生产的过程。人类通过大工业,进行标准化、连续性的大规模生产,有效地降低了生产成本,做到了让所有的人能够以最低的成本得到同样的东西。在今天有了人工智能,人工智能和移动化结合起来,在社会生产中,就能够产生满足个人需求的这样一种能力,也就是面向每个个人的需求进行生产的能力。我们相信,从未来发展来看,大数据应用的最大潜能就在于,突破工业生产的限制,从而完成真正的面向个人的社会产品的生产和分发,这就是精准化。尤其是在信息和知识的生产和分发领域。
出版业融合发展与知识服务的个人化
讲到出版业的融合发展,我想就需要回到出版业的初心,到底出版业是什么?
我认为,出版业从功能上讲有两大基本功能:一个是知识产品的生产组织者和运营商,另一个是娱乐产品的生产组织者和运营商。传统出版业是以什么方式来做这样一种工作呢?就是知识或娱乐产品的大规模的复制和分发。
面向未来,我们面临的将是个人化的知识服务,换句话说,就是面向个人的知识生产和分发。目前在互联网上所看到的各种知识服务类应用,按照易观国际的数据分类,跟出版的传统领域相关和接近的有两大类,一个是移动阅读类,一个是教育类。
移动阅读类的基本是以小说这种娱乐性的应用为主;教育类也即知识传承类,大多数的应用是怎么帮着孩子做作业,现在很有名气的知识应用类APP“得到”,是做所谓高端知识分享,知识服务的,在这个排行榜上排在前20位,也就是说没进入前15位。
这样一些应用大多还是停留在面向所有人服务的层面。有没有改进的空间呢?我相信会有。这种改进需要一种新的思维,即把工业化时代的大众传播向智能化时代的个人传播发展的思维。实现这样一种新的思维,首先要进行一个对既有的知识内容,以及文学和娱乐内容的数据库开发,只有建构这样的数据库,建立呼应用户需求的标签体系,才有可能把里面的知识打开了揉碎了,然后提供个性化的信息服务。做这样的数据开发,需要对知识进行标签化。从移动传播过程中精准分发的实践看,首先要有个人化的用户画像,用户画像拿什么画?拿标签来画,标签就是数据库的像素,标签越多,用户画像越精准;同样,内容本身的标签越多,对内容特征的描述就越清晰,我们就可以把用户的需求和数据库里面的内容作有效的匹配,而其面向用户需求的分发也就越精准。没有这样一种内容数据库和用户数据库的开发,就无法实现个人化的知识服务。
当前,知识产品的即时更新成为一个新的趋势,这也是互联网时代知识生产的一个新特点。过去的知识生产实际上是把信息进行结构化之后变成知识,在某种意义上讲,知识是信息的结构化。今天我们所看到的互联网上的知识生产是即时进行的,互联网上的各种问答类应用,本质上都在进行知识的即时生产和更新,这也带来一种新的知识服务的形态。在这个意义上,它和信息服务的边界正在消失。
这样一种变化,使得我们面对一个新的可能,就是在用户需求与知识数据库匹配的基础上实现信息的个人化分发。这种个人化的分发,可以与智能化设备结合起来,比如智能音箱是不是可以成为信息分发的新工具?甚至未来办公桌面上的打印机,也可以成为面对企业的资讯服务、知识服务的智能化终端。随着智能化的发展,传统的大众传播和大众出版的逻辑被打破之后,我们将会发现更多面向个人的知识服务的可能性。
当前,用户需求与知识数据库匹配的算法日趋完善,把知识产品进行个人化分发的渠道技术迅速发展,比如个人及家庭终端的普及,以及新的智能终端的开发,特别是自然语言识别技术的成熟,使我们有条件掌握到用户的需求,实现知识数据库与用户需求的匹配,并借助自然语言识别技术进行人机交互以提供个人化信息服务,来完成个人化的知识分发。结论就是,基于人工智能的知识服务的个人化,将会成为未来出版业互联网化的产品发展趋势。一个新的出版业的巨头将会是这样一个平台及其服务的运营者。
﹝本文为国家社科基金重点项目“以媒介融合推动新型传播体系的构建研究”(批准号:14AZD039)课题成果。﹞
(作者系中国人民大学教授、博导、项目首席专家。)