重新定义智能媒体*
2022-11-22黄升民
黄升民 刘 珊
“人工智能”已经成为一个社会热词,它既是诸多产业竞争的领域,也是国家发展的战略重点。自2017年起,人工智能已连续三年被写入我国《政府工作报告》,同年7月,国务院正式发布《新一代人工智能发展规划》,将人工智能技术与产业的发展上升为国家重大发展战略。就传媒领域而言,无论是业界还是学界,必然受到这个与大数据技术伴生的人工智能技术的深刻影响;必然在理论层面和实践层面深入思考流程再造和产业布局;必然在国家重大发展战略框架下做出全方位的适应性调整。
通常来说,我们将人工智能应用于媒体带来的改变,统称为“媒体智能化”,用“媒体智能化”描述一个智能化程度不断提升的过程。在这个过程中,出现了“智能媒体”这一概念。学界比较典型的概念界定包括:“在技术助力下能够更懂得人类的需求的信息服务介质或机制。”①“以往所有媒体形式融合人工智能技术,同时辅助以最新的技术设备和大数据分析,形成的内容无尽且信息不存在限制的媒体。”②“通过模拟人类智能实现各种认知能力以及协同机制,使人与人、物与物以及人与物产生联系的自主实体。”③但事实上,这些定义偏向于对智能媒体“功能”的解读,却无法阐释智能媒体的“智能”究竟是什么,也缺少对于智能实现路径的体系化解读,因而无法给业界带来相应的理论指导与借鉴。这也是我们试图重新探讨这一话题的重要原因:首先,传媒本身与信息、与人密切关联,具有极强的产业特殊性,这种特殊性决定了人工智能在这个领域的应用和发展具备自身的独特性与差异性,因此需要构建独立的理论体系与指导框架;其次,这种特殊性决定了智能媒体实现的底层逻辑,是对事物的认知、理解,进而进行预测和决策,完成智能化的运营。接下来,我们将从三个层次展开,剖析智能媒体的再定义与实现逻辑。
一、智能媒体的基础:从“认知力”到“理解力”
清华大学人工智能研究院常务副院长、国家重点基础研究发展计划(973计划)项目首席科学家孙茂松在2018年接受媒体采访时曾表示,目前人工智能总体上依旧处于无理解的人工智能阶段,下一个挑战是开发具有“理解能力”的人工智能。在心理学的范畴,认知和理解是学习的重要过程,认知和理解之后才能产生知识。在当下成为人工智能主流的深度学习,本质就是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而提升分类或预测的准确性。④基于日益优化的数据、算力和算法环境,深度学习被广泛运用于各行各业之中,在这其中以语音识别、图像识别和自然语言处理三个方面为主⑤,其成果显著且成为智能技术的基础。同样,这三项可以让机器形成“看懂”“听懂”“可沟通”的认知能力技术,对于传媒领域而言,也是实现理解内容、理解用户、理解场景的基础智能技术。
(一)认知并理解内容
当我们在媒体产业探讨“智能化”这一现象时,“大数据”和“算法”是常常被提及的两个概念,并进一步与“个性化推荐”相关联。但是,当算法作为具有中介权力的把关人时,其执行的两个主要功能是充当“需求预测器”和“内容创造者”。⑥要做到有的放矢的推荐,平衡“精准”与“信息茧房”,前提就是正确理解内容。
首先,从信息传播的编码与解码角度来看,信息的传播本质是一种编码与解码的过程,媒体在信息传播中需要完成对图文、声音、影像的生产与加工。因此,我们对于智能媒体的基础要求是能够准确的“识别”、合理的“还原”、适度的“加工”。对于计算机来说,“识别”往往和“打标签”相关联,“标签”又常常和“画像”成对出现,表征的都是理解的能力。Netflix在2014年透露,工作人员对内容类型、剧情叙事、角色道德水准等内容属性进行精准的分类和评级,同时在机器算法的帮助下,共识别出超过76897种“微标签”,以实现对内容的解构。目前,在媒体处理引擎Archer等技术平台的支持下,Netflix实现了通过人工智能技术识别内容中物体、人类动作以及文字等各项元素。例如,借助Archer平台上的文本检测算法和图像识别算法,Netflix可以清晰识别视频中所包含的文字,以及视频中人类的姿势动作等。这些探索,能帮助Netflix更好地利用AI技术拆解内容、理解内容、精准推荐、优化生产。
其次,从媒体传播的引导力和价值观角度来看,用主流价值导向驾驭算法已经成为行业发展的必然与必须。“智媒时代,基于人工智能和大数据的各种识别、分析、分发、互动、创作技术正在逐步嵌入媒介生产系统……这一切为主流价值的传播提供了更大的舞台。但与此同时,一些蕴含在新技术手段中的结构性问题也正在动摇主流价值的根基,成为我们不得不面对的挑战。”⑦此前,今日头条创始人张一鸣一句“算法没有价值观”,把利用算法推荐和分发内容的互联网平台推上了舆论的风口浪尖。此后,在优化算法价值观的规划中,字节跳动公共政策研究院表示,一要解决内容生产的低质化问题,压实社交平台、信息平台和创作者的社会责任,提升全体用户的道德素质和网络素养;二要实现社会价值融入算法设计,发挥对内容生产和传播的“奖优罚劣”把关作用,尽快迈向智能管网治网;三要防范算法黑箱的潜在风险,促进算法的透明化、需要目标设定的公平正义和公开透明、算法原理的科学以实现正确的目标,在有人工训练的情况下,在社会价值的指引下正确选取指标和行为特征,避免产生系统性偏见和歧视。当然,如何为算法赋予价值观的问题需要更加长久的业界探索和学界研究来解决。目前,利用人工智能提升内容审核的效率与效果已经在国内外的互联网平台实践中初见成效。2019年8月1日,字节跳动发布了反低俗工具“灵犬3.0”,采用“BERT模型(Bidirectional Encoder Representations From Transformers)+半监督学习”的技术,提高了相关文本的识别度和图像识别能力。同时,字节系内容平台通过人工标注和模型训练的方式,能够以93%的准确率识别主流价值内容,并在此基础之上优化内容推荐,相关优质文章将获得1.5~2倍的加权推荐。
(二)认知并理解用户
大众传播时代,媒体产业在完成“理解用户”这一任务时,是在社会学、人类学、心理学等研究方法的基础上进行的受众测量、消费者研究。人工智能技术与新媒体环境的蓬勃发展,让我们可以更加便捷地展开多元化、多样态的用户研究,文本分析、消费者画像等技术被广泛应用,极大提高了理解用户的效率与精度。
首先是理解用户“是谁”。“基于大数据技术的消费者洞察极大还原了消费者在虚拟数字空间以及现实空间中的真实状态。数据更新速度快,保证了消费者洞察的数据时效性;数据来自多元场景,可以立体化、多角度解读消费者的行为和态度。”⑧目前,新媒体机构普遍将用户画像作为一项基础技术,并且在画像颗粒度方面不断精细化。这一方面要求新媒体机构掌握更多来源和类型的数据,另一方面则在很大程度上考验其算法和算力。所以,超大型的互联网媒体机构,更有可能完成精细化程度较高的用户画像。例如,YouTube一方面基于Google的账号体系,通过cookie、像素代码、服务器日志等常规意义上的数据采集技术对用户数据进行采集,并将数据大致分为个人数据、设备数据、活动数据以及位置数据四个维度,数据上传至Google服务器并通过后台机器学习技术进行分析处理,刻画用户画像,该用户画像包括基础信息、兴趣爱好、行为习惯等在内的超过60个标签,每个标签都详细标注了形成原因,实现了对用户的基本洞察。另一方面,由于机器的认知缺陷以及用户行为偏好的不稳定性,通过机器学习技术自动描绘的用户画像在某些情况下可能失去精准性,为此,YouTube还开放了一定的权限给用户,允许他们对自身标签与画像数据进行修改,将机器理解与用户人为修正相结合。
其次是理解用户的需求。段淳林等将智能广告的研究划分为三个维度,即用户需求维度、算法推荐维度和场景匹配维度,并认为,利用大数据技术搭建起集数据分析、数据挖掘、数据安全等功能为一体的智能数据管理平台可以准确分析和理解用户行为特性,建立用户需求偏好的算法模型,并不断训练优化,掌握用户的动态化、潜在性需求和预测未来需求。⑨目前,在人工智能技术的支撑之下,我们基本做到了对用户即时需求和长期需求、显在需求和潜在需求进行精准划分与动态描摹。例如,阿里妈妈在2020年7月再次升级达摩盘,并将RFM(最近一次消费Recency、消费频率Frequency、消费金额Monetary)模型与消费者的情感因素相结合,从需求和价值维度对消费者需求进行了重新分类,从而帮助品牌商家找到最具价值的“超级用户”,即高净值用户、高价值用户、高传播力用户。达摩盘同时还支持“超级用户”的Lookalike人群投放,系统自动识别种子人群的显著特征和显著商品偏好,投放时加大所选“超级用户”的特征在扩展人群中权重,找到真正的高价值人群。
(三)认知并理解场景
“内容”和“用户”产生联结、互动的环境,我们将其称之为“场景”。2018年,中国传媒大学广告学院基于对大量品牌主、广告代理机构、媒体平台的调研,推出了《新营销白皮书》,对营销中的“场景”做出了这样的界定:“场景往往是由多维时空交织所形成的特定情境。消费者不同人生阶段、生活状态下会有各种‘需求场’,传播流程中有不同‘媒介场’,消费环节有线上线下各种渠道的‘卖场’,多维度场景交叠,就会勾勒出这一特定情境下消费者的独特画像。”作为人工智能的底层逻辑,算法恰好能够通过对海量数据的挖掘分析,找寻并建立复杂要素间的关系,遵循“海量内容—用户需求—多维场景”的基础逻辑,为用户构建更加贴合沉浸的场景。⑩
首先是从信息传播的角度理解场景,其关键词是“还原”。约书亚·梅罗维茨(Joshua Meyrowitz)在《空间感的失落:电子传播媒介对人的社会行为的影响》一书中提出,场景应该被视为信息系统。媒体智能化带来的理解力升级,可以有效帮助我们还原信息传播的场景,为用户带来更具真实感的沉浸式信息互动。例如,在新闻内容领域,从精确新闻、众包新闻发展到数据新闻和人工智能新闻,其实折射出的都是技术与信息传播相结合带来的巨大改变。尤其自2013年《纽约时报》的数据新闻作品《雪崩》之后,将大数据技术应用于新闻内容生产与分发逐渐成为媒体智能化的一种主流趋势。2020年12月30日,由新华社全媒编辑中心联合知乎共同推出的创意视频《2020,36亿数据绘出这条线》上线。该视频以上文提到的问答作为开篇,对2020年全网36亿条新闻基础数据、18000条热搜榜单以及知乎全年近万条万赞问答进行分析,绘制出2020年人们共同的情感曲线,将新闻图片、视频与数据可视化效果完美融合。截至2021年1月1日该视频全网浏览量突破2.7亿,并在多家电视台卫视频道新闻栏目播出。
其次是从信息需求的角度理解场景,其关键词是“契合”。结合用户画像,人工智能帮助我们更好地理解了用户在不同场景中的差异化需求。“情境匹配通过判断用户所在场景中的行为特征和外部环境,运用符合用户生活形态的设计,将产品服务的解决方案与用户的潜在需求匹配起来,以实现用户需求与服务满足的有效衔接。”简单来说,即便只是“喝咖啡”这样的行为,在不同的时间和地点,都会有不同的意义和目的,喝咖啡的人在不同场景对于信息和媒体的需求也存在差异,这就是认知场景的重要性。例如,申通德高基于户外大数据开发了VIOOH广告投放系统。该系统可以依据场景特点进行动态化的广告投放——独特的时间、天气、经纬度、人群画像等成为了广告投放的触发条件。以疫情期间上海地铁的公益广告投放为例,申通德高以电子双联屏为内容载体,在援鄂医生所在医院附近的地铁站点中进行分屏投放。左屏展示“最美逆行者”的照片和介绍,右屏为乘客提供附近的发热门诊位置等便民信息。另一个典型案例则是为某防晒产品客户执行的广告投放活动:结合防晒产品的特殊性,只有当地面温度达到38℃或者更高时,广告投放机制才会被触发并展示广告。其实,无论是传播还是营销,本质上强调的都是一种匹配,与大众传播时代的5W模型一致,想要解决的是人、时间、信息、方式的匹配。大数据和人工智能让我们能够更加有效地完成这种匹配。
这三个层面的认知理解,让媒体智能化向前迈进了一步,为下一步的决策和创造打下坚实的基础。
二、智能媒体的进阶:从“理解力”到“决策力”
相对来说,理解内容、理解用户、理解场景,还是一种静态的、孤立的理解,在实际的媒体运营中,这种静态与孤立的理解会给业务的发展、技术的升级带来诸多限制与瓶颈,因此需要完成下一步的进阶与突破——从单一理解,进化到关系理解与动态理解。我们曾经撰文探讨互联网与互联网思维的本质:互联网带来的是三个“无限”,即无限的需求、无限的服务、无限的传输,在一个双向互动的平台上完成资源的配置。事实上,“无限”和“互动”也是媒体智能化进阶的两个关键,在这种“无限”和“互动”中,媒体的智能化程度逐渐提升,完成了从“理解力”向“决策力”的过渡。
(一)无限的网络+无限的数据,从事实辨析到关系理解
目前,互联网的发展已经从“网页的链接”阶段过渡到“数据的链接”阶段,并朝着“语义网络”的阶段发展。在这个过程中,从海量的数据中提取有用的知识,既是大数据分析的关键,也是人工智能获得知识、构建理解力的关键。知识图谱技术应运而生,帮助我们从原始数据出发,采用一系列自动或半自动的技术手段,从原始数据中提取出知识要素(即事实),并将其存入知识库的数据层和模式层。这是一个迭代更新的过程,根据知识获取的逻辑,每一轮迭代包含3个阶段:信息抽取、知识融合以及知识加工。通过知识图谱,不仅可以将互联网的信息表达成更接近人类认知世界的形式,而且它提供了一种更好的组织、管理和利用海量信息的方式。
2020年12月,在Data Fun Talk年终大会知识图谱论坛中,来自百度、阿里巴巴、美团等机构的行业专家分享了各自对于知识图谱技术及其应用的理解,让我们看到了行业机构对这一技术的现实应用。其中,百度资深研发工程师王泉提到:“直观来说,知识图谱就是以图的形式来展示知识,节点用来描述客观世界中一些实体或者概念,边用来描述实体和实体之间的关系或者实体的一些属性。通过这种结构化的知识表示形式,知识图谱将存在于客观世界的丰富知识表达成机器能够处理和理解的形式,从而使机器能够像人类一样去认知世界并且做出合理的决策,进而为人类提供更加广泛的智能化服务。”与谷歌一致,百度知识图谱技术同样始于其搜索引擎业务,但目前已经广泛赋能搜索之外的业务和产品线。近两年,百度知识图谱技术建设的重点在多元图谱的异构互联;图谱的主动收录与自学习;多媒体知识、复杂知识以及行业知识的理解构建。从数据量级来看,百度知识图谱覆盖了十亿级实体、千亿级事实,涉及类目40多个,已形成当前规模最大的中文知识图谱,覆盖人物、影视、音乐、文学、商品、餐饮、旅游、出行等垂直领域。对于媒体机构而言,一个覆盖了“十亿级实体,千亿级事实”的知识图谱,就是一个辨析事实真伪的基础工具,巨量的冠有“新闻”的报道蜂拥而至,都必须经过严密的数据比对与筛查。
然而,仅仅辨析事实真伪还不够,还需要进一步理解事实与事实之间的关系。对于媒体的理解力提升来说,知识图谱相当于一个巨大的关系网络:计算机能够在数据库中建立概念间的链接关系,从而以最小的代价将互联网中积累的信息组织起来,成为可以被利用的知识。简单来说,我们可以从一张庞大而复杂的关系网络中去认识单一概念,对其形成更加立体的认知。虽然知识图谱的源点是谷歌对自身搜索引擎技术的优化,但其反映的当然也是计算机对于搜索需求以及检索数据库中所有数据的理解能力。于是,无限的网络催生无限的数据,这些数据在各类互动平台中建立起联结,同时又在互动过程中产生、消亡、新生、替代、融合,为计算机的理解力提供一个从点到线、从线到面的进化过程。在这样一张巨大的关系型数据网络中,标记、辨别、比对、认知,都有了更加丰富的价值和意义,计算机也得以实现从单一理解向关系理解的转变。
(二)无限的情节+无限的场景,实现对时间与空间的动态理解
笛卡尔认为一无所有的空间是不存在的;牛顿建立了绝对空间和绝对时间的概念;爱因斯坦的广义相对论认为空间充满了场和物质,场作为时空的结构性质而存在;大爆炸理论认为,宇宙由一个“奇点”而来,时间和空间作为物质的存在方式随着“奇点”的爆炸出现了……从理解力的角度来看时间和空间,相当于为我们认知人、事、物提供了基本的维度和坐标,其重要性是不言而喻的。简单来说,时间维度上形成了“情节”,空间维度上形成了“场景”,只有在具备时间线的场景中去进行独特性的匹配与校正,才能在理解的基础上做出预判与预测——显然,这对于媒体实现对人、事、物的动态理解来说,是无比重要的。更重要的是,预判趋势正是数据挖掘分析的重要意义,也是人工智能能力的重要表现。
目前,时间序列数据(Time Series Data)在趋势预测任务中扮演了十分重要的角色。时间序列分析不仅可以从数量上揭示某一现象的发展变化规律或从动态的角度刻画某一现象与其他现象之间的内在数量关系及其变化规律性,达到认识客观世界之目的,而且运用时序模型还可以预测和控制现象的未来行为。也就是说,当我们将大量观测对象用时间线串联起来之后,就可以实现分析过去、监测当下、预测未来的目标。同时,由于各行各业所处的情境不同,其对趋势预测发挥的效果也有所不同。在追求预测准确性、稳定性和可解释性的过程中,我们往往还需要对影响预测目标的多方面因素以及因素背后的多元关系——即元素所处情境进行考虑,从而更好地完成对于“变化”的理解。数据挖掘与趋势分析并不是新鲜概念,时间序列分析与研究也是统计学的经典问题,但是搭载机器学习与深度学习,时序数据挖掘,尤其是融合情境的时序数据挖掘可实现的预测能力正得到极大的提升,并在零售、金融、医疗与媒体等多个领域有了更加广泛的应用。
2016年,百度云在天工平台上正式发布了国内首个云端时序数据库产品TSDB(Time Series Database);2017年2月,脸书开源了Beringei时序数据库;2018年3月,腾讯云推出了云上时序数据库CTSDB(Cloud Time Series Database);2018年10月,阿里云发布了时间序列数据库TSDB(Lindorm Time Series Database);2020年10月,亚马逊云服务(AWS)宣布Amazon Timestream正式可用;谷歌的Monarch被公认为当今全球最大规模的时序数据库,不过并未开源。在与媒体强相关的业务领域,推荐系统可能是能够直接检验“预测”分析准确性的场景。在加入“时间”和“场景”所组成的“环境”坐标之前,“推荐”是一种静态的行为,无法契合现实生活中用户的“动态”现实。因此,研究者试图让计算机理解和建模连续的用户行为、用户和条目之间的交互,以及用户偏好和条目受欢迎程度随时间的变化,以更精确地描述用户环境、意图和目标、物品消费趋势等,产生更准确、定制化和动态的推荐。例如,百度在2021年1月上线的EasyDL时序预测模型可以充分利用协变量,提升模型精度:在进行门店销量预测时,除了涉及时间因素,还会与当日天气状况、门店周边环境等因素有关,而这些变量都可以被加入EasyDL模型中用以提升预测的准确度。
自动驾驶的重要目标是让机器能够理解具象的空间,但在媒体领域,空间的概念却远大于此。只有实现从单一理解到关系理解,再到时空交织下的动态理解,才能为下一步的预测和决策做好准备。
(三)无限的链接+无限的互动,完成理解到决策的进阶
人工智能的目标就是让计算机能够模拟人类进行感知、决策并执行。在DIKW模型(Data-to-Information-to-Knowledge-to-Wisdom Model)中,数据、信息、知识、智慧层层递进,而智慧又可以被简单地归纳为做出正确判断和决定的能力,是对知识的最佳使用。从这个角度而言,数据是学习的基础,学习是提升理解力的渠道,理解力则是决策的前提。事实上,人工智能领域始终致力于提升计算机的学习、理解与决策能力。从2006年杰弗里·辛顿(Geoffrey Hinton)提出无监督深度置信网络的训练方法到2017年AlphaGo Zero问世,折射的也是研究者对于“学习”方式的探讨,对于“决策”智慧的重视——通过建立、模拟人脑的信息处理神经结构来实现对外部输入的数据进行从低级到高级的特征提取,从而使机器学习、理解数据;而深度强化学习则将深度学习和强化学习技术结合起来,其最大特点是计算机在与环境的互动中学习,根据交互获得的奖惩获得知识、更新策略以更加适应环境。在从互联网到物联网的发展过程中,万物互联形成链接加上无限的互动,为机器的学习带来无限广袤的平台。
本质上,AlphaGo Zero是在不断的“推演”和“复盘”中学习围棋,并寻求最佳“落子”,即决策。这个决策过程,需要有真实的“反馈”来帮助计算机学习和修正。在2020年9月召开的“首届智能决策论坛”上,中国科学院自动化研究所所长徐波在致辞中表示,决策智能基于对不确定环境的探索,需要根据所获取的环境信息和自身的状态来进行自主决策,并使得由环境反馈的收益最大化。这一由反馈形成的系统闭环,将使人工智能拥有更完整的表现形式。他认为,智能是能够在一种不确定的环境中做出合适的行动,或者做出合适的选择和决定的能力,也就是决策智能。这正是我们认为互联网与大数据的发展会真正实现理解力进阶的原因。无限的网络带来了无限的数据,形成了无限的关系,在无限的时空场景中彼此交织,形成无限的链接和无限的互动,从而帮助计算机实时调整、不断迭代,无限接近人类的决策过程,却又比人类具有更大的智慧潜能,因而极有可能制定出相对的“最优”决策。
在媒体产业中,小到内容策划、推荐分发、流量分配这样的“算法”级别,大到产品开发、商业变现、策略制定这样的“战略”级别,其实都是“决策”。因此,媒体领域的人工智能探索与应用,始终与最优解判断、智能决策相关联。当下无论新旧、无论大小、无论国内还是国外,媒体机构都在朝着智能化的方向转型和发展,并将数据、云、AI作为所有业务的底层架构,赋能自身的业务与产品。当然,由于当前的人工智能个体还处于“弱”阶段,为了避免盲从算法、偏信数据,媒体机构普遍采用“人脑+人工”的方式来保障决策的正确性。媒体产业在完成数字化、融合化、数据化的过程中,正成为人工智能演练与进步的主战场。而媒体的智能化变革,正是在利用数据、网络、学习和互动提升理解力,实现对用户的理解、内容的理解、场景的理解后,逐步实现智能决策,并向着智能的终极目标迈进。
至此,媒体的智能化发展可以说实现了基本的成功,拥有了更有深度和广度的理解力,也拥有了基于理解和知识进行判断、预测的能力,从而帮助人类寻找多元复杂环境中的最优解,实现智能的决策。但是,决策力的下一步,是真正智能皇冠上的明珠——创造力。
三、智能媒体的突破:从“决策力”到“创造力”
默里·沙纳汉在《技术奇点》中有两个颇为重要的观点。其一:“只有拥有了学习能力,才能获得和维持新技能。事实上,学习的能力,不管是什么形式的学习,都是建立智能的基础。”其二:“让机器拥有普通智力的最基本要求是拥有常识和创造力。这种创造力不是艺术家、作曲家或者数学家的创造力,而是普通人也有的创造力,儿童特别富于这种创造力。这种创造力指的是创造新的行为方式、发明新事物或者用新方法使用旧东西的能力。”正如著名的莫拉维克悖论所描述的那样:“要让电脑如成人般地下棋是相对容易的,但是要让电脑有如一岁小孩般的感知和行动能力却是相当困难甚至是不可能的。”事实上,关于真正的智能究竟是什么,其实并没有统一的标准答案。我们认为,真正的机器智能,至少要实现从“决策力”到“创造力”的飞跃。这种飞跃,还需要实现两个层面的突破。
(一)从“专用”到“通用”的突破
当前的人工智能正处于弱人工智能阶段,计算机程序可以在某一个方面达到非常领先甚至远超人类的水平,但却也只能局限在这个领域当中——这是目前阶段人工智能与真正智慧生命体最大的区别之一。“一个深度学习系统一般是以特定任务为指向的,它无法同时胜任另一个领域的工作,迁移能力非常受限;而一个智力正常的人常常能在一个不熟悉的领域举一反三,变通适应。”而所谓的“通用智能”,“我们指的是在各种环境下解决问题、学习、采取类似人类的有效行为的能力。”这种能力,不光要求智力水平,还要求常识水平,而后者对开发者来说显然是极具挑战的。目前,还没有任何一个通用智能系统能够接近人类水平:具有协同多种不同的认知能力;对复杂环境具备极强的自适应能力;对新事物、新环境具备自主学习的能力。因此,人工智能领域的一个重要分支就是“类脑智能研究”,即借鉴脑神经机制和认知行为机制来发展人工智能。
2020年10月,张悠慧、施路平等人在研究中提出了“神经形态完备性”的概念,这是一种更具适应性、更广泛的类脑计算完备性的定义,它降低了系统对神经形态硬件的完备性要求,提高了不同硬件和软件设计之间的兼容性,并通过引入一个新的维度——近似粒度(the approximation granularity)来扩大设计空间。相关研究成果以论文的形式发表在了《Nature》2020年第586卷上。同时,文章的作者之一施路平教授还曾在2019年北京智源大会“智能体系架构与芯片专题论坛”演讲时表示,“基于碳基已经发展出现有的人类智能,基于硅芯片已经发展出强大的机器智能,一旦实现人类的全脑解析,采用类脑计算构建通用人工智能是完全没有障碍的。”可以看到,在仿造和模拟人脑的道路上,人工智能还在持续发展,其本质都是为了更好地提升机器的理解、学习、决策及执行能力。
从1960年赛博格(Cyborg)概念诞生,到今天元宇宙(Metaverse)概念大行其道,超沉浸和强互动的数字化虚拟现实始终未曾远离人类的想象和探索。而人工智能一旦从专用进入通用阶段,无疑将在最大程度上促成这种人类与技术的深度耦合,给人类社会带来全方位的颠覆性变革。而媒介作为人的延伸,显然会是这种耦合的起跳板与演练场:一方面会因为“人工智能+”而迎来全面变革,一方面也会因为“信息+”给人类社会带来彻底的颠覆。2021年10月28日,Facebook将公司更名为“Meta”,公司将致力于实现一种最大限度的、直接来自科幻的、游戏般的连接体验,绘制一幅更大、更有能力的社交图谱,并代表新的计算平台和新的参与平台。这也再次让我们确信:人类也许无法预知人工智能在多久之后真正进入通用智能的阶段,但这个阶段一定会与传媒产业紧密捆绑。
(二)从“学习”到“创造”的突破
机器是可以学习的。机器学习的发展历史,其实就是人工智能的发展史。一直以来,我们希望计算机能够模拟或实现人类的学习行为,以获取新知识或技能,重新组织已有的知识结构使之不断改善自身的性能。但是,学习不等于创造。詹姆斯·巴拉特在《我们最后的发明:人工智能与人类时代的终结》一书中指出:“技术奇点本身会带来智能(也即造就初始技术的、独一无二的人类超强实力上的变化),这就是它跟其他所有革命不同的原因”。数学家斯蒂芬·奥莫德罗(Stephen M.Omohundro)曾经预测,人工智能足够强大之后,其自我意识、自我改进系统会发展出类似人类生物动力的4种主要动力:效率、自我保护、资源获取和创造力。而AI的创造力动机会让系统生成新的方法来更有效地达成目标,或者避免目标无法以最满意的形式达成结果。这意味着系统的可预测性很低,因为创造性的设想是原创的。系统越是智能,达成目标的路径就越是新颖,系统也就越是超越我们的见识范围。
弱人工智能阶段,计算机似乎也可以具有一定的创造力。例如,2021年9月22日,微软旗下的小冰公司举行了第九代“小冰”发布会,宣布了多项框架升级,并推出了AR内容生成领域的最新进展。这其中,包括社交App小冰岛、第三版诗歌与绘画创作模型、AI歌声合成技术X Studio 2.0、艺术家创作动机辅助技术和AI“人类观察者”Merror等。设计师、画家、主持人、歌手、诗人,这些都是微软小冰的身份。每一个身份,都与人类最具创造力的工作相关。在文学和艺术领域的创作上,AI已经取得了一些较好的尝试。但这些创作事实上还是基于其程序背后的算法。
事实上,按照当前的人工智能研究思路来看,其实很难让机器拥有真正“创造”的能力。人们往往希望人工智能做到“最优”,希望人工智能不要“出错”,但我们认为的“出错”可能反而是通往创造的一条道路。如,通用人工智能可以自我进化。运用达尔文的进化论发展起来的Evolutionary Computation算法正是借用以上生物进化的规律,通过不断迭代改进当前解,逐步逼近复杂工程技术问题的最优解。但是,亚利桑那大学的生物学家们发现:进化的一个重要驱动力是细胞所犯的错误以及生命体如何应对这种错误。再如,起初熵在热力学中用来描述一个系统“内在的混乱程度”。香农在定义信息熵的时候借用了这个概念,使人类第一次对信息有了数学的认识:信源编码的极限是信源的熵,信道编码的极限则是信道容量。信源编码的目的是尽可能高效地表示信息源,即数据压缩;信道编码的目的则是尽可能高效的让数据可靠无误地通过信道。2009年,密歇根大学的化学工程教授莎伦·格罗泽(Sharon Glotzer)则在实验中发现了熵在复杂性与秩序的出现之间所能起到的强大而又矛盾的作用。从这个角度来看,正确和错误、稳定和混乱,彼此之前是一种复杂的辩证关系,是一体两面的现实存在。在我们探讨大数据和人工智能时,始终需要记住的是大数据本身的特质——拥抱混杂,挖掘价值。因此,人工智能真正的突破,很可能不是追求永恒的“正确”,而是在混杂中寻找机会,在错误中寻找创新,这才是创造。那么,按照当下人工智能发展的资源配置来看,媒体领域恰好是拥有最大量混杂数据、最先进网络联结、最强大算力支持的板块,因而成为最有可能推动创造性进化的领域之一。
认知和理解、理解并决策、学习中创造,这是智能媒体实现的三条底层逻辑。基于这三条逻辑,我们得以明确智能媒体的真正内涵,也探寻到了其未来的发展方向。
四、结语:重新定义智能媒体
综上所述,我们可以看到:第一,传媒产业作为一个以传播为核心,通过与人沟通完成产品和服务的领域,其智能化发展的第一阶段是让计算机拥有更强的理解力;第二,这种智能化的发展,是以数据、算力、算法作为基础与支撑来推动实现的;第三,这种智能化的实现,既要面临弱人工智能向强人工智能飞跃的通用难题,也要面对传媒产业特殊性带来的独特挑战。人工智能已经走过了近70年的发展历程,几经曲折终于站在了离真正智能最近的位置。在传媒产业中,媒体智能化发展的终极目标,是打造出智能的媒体。结合此前的论述,我们对智能媒体做出如下界定:智能媒体是具备较高的识别与理解能力,能够在营销传播场景中进行最优决策,并具备通用性进化与自我创造潜力的媒体。而媒体智能化,正是对媒体朝着这个目标发展的过程概括。
从当下我国传媒产业的发展速度来看,对于传媒与媒体的研究,应当具有较强的实践性与应用性,能够真正指导产业的发展、回应产业的痛点、解决产业的问题。因此,对智能媒体的概念界定,也应当能够有效地从理论转化为实践,从框架变成模型。在近两年展开的关于新型主流媒体建设的研究中,我们针对当前传媒产业的实际发展态势,提出了“全媒巨人”的模型,其本质也是智能媒体概念的一种衍伸与具体应用。此外,通过与业界机构的探讨与碰撞,我们也初步验证了这一模型框架的可行性。
在勾画“巨人”即智能媒体的模型时,我们将智能算法视为“大脑”与“中枢神经”,将智能化内容运营视为“心脏”,将智能化经营视为“肺部”,将智能化网络与终端视为“筋骨”,将数据与网络视为“血液”。利用这样的架构设置,算法大脑充分决策,内容心脏健康有序的跳动,经营资源高效适配,肺部呼吸自如,网络融合一体且安全可靠,血液顺畅流动,机体充满生机活力。这一模型的建构,是以大数据与人工智能技术的应用为目标,通过对当下媒体机构的核心要素进行归纳之后完成的,可以很好地实现当下媒体对于数据化、融合化、智能化发展的需求,囊括了内容、经营、服务、传播等方面的功能。但是,衡量其“智能化”的程度,恰好需要结合本文所讨论的几个要点来进行,即理解力、决策力、通用性进化力与自我创造力——概念与方向虽然是正确的,但模型的真正实现,还需要长久的探索与实践。
理解力与决策力的实现在今天的传媒产业中,已经成为基本事实并持续优化,但是通用性进化与自我创造的能力实现却很困难,且涉及到众多伦理与法规问题,将是今后很长一段时间内媒体智能化发展乃至整个人工智能领域研究的重要方向。
注释:
① 卿清:《智能媒体:一个媒介社会学的概念》,《青年记者》,2021年第4期,第29页。
② 闫欢、靖鸣、刘家豪:《智能媒体时代网络安全隐患与治理策略》,《新闻爱好者》,2017年第11期,第56页。
③ 喻国明、杨名宜:《平台型智能媒介的机制构建与评估方法——以智能音箱为例》,《新疆师范大学学报》,2019年第2期,第121页。
④ 余凯、贾磊、陈雨强、徐伟:《深度学习的昨天、今天和明天》,《计算机研究与发展》,2013年第9期,第1804页。
⑤ 陈仲为:《深度学习的发展以及应用》,《现代计算机》,2019年第6期,第48页。
⑥ 罗昕:《算法媒体的生产逻辑与治理机制》,《人民论坛·学术前沿》,2018年第24期,第25-39页。
⑦ 龙耘、袁肖琨:《智媒时代的主流价值引领:内涵、挑战及策略》,《新闻与写作》,2020年第12期,第42页。
⑧ 姜智彬、马欣:《领域、困境与对策:人工智能重构下的广告运作》,《新闻与传播评论》,2019年第3期,第56页。
⑨ 段淳林、宋成:《用户需求、算法推荐与场景匹配:智能广告的理论逻辑与实践思考》,《现代传播》,2020年第8期,第119-128页。
⑩ 喻国明、耿晓梦:《算法即媒介:算法范式对媒介逻辑的重构》,《编辑之友》,2020年第7期,第49页。