网络短视频中的人工智能技术:应用、反思与建议
2020-09-26周仁平罗弈为
周仁平 罗弈为
【内容摘要】当前,人工智能技术已较广泛地应用于网络短视频,包括内容生产、分发推送、管理审核等领域,为行业发展提供了强有力的技术支撑。本文在梳理人工智能技术在网络短视频中的应用现状的基础上,对人工智能技术的管理审核短板、内容生产的负面效应、隐私保护困境等几个突出问题进行了反思和探讨,并从借力区块链技术、保持技术理性、优化算法、推进隐私多元共治等方面提出了相应建议。
【关键词】人工智能;网络短视频;区块链;算法推荐
人工智能技术是计算机科学的一个分支,自20世纪50年代以来,已取得长足发展。如今,人工智能已广泛应用于安防、金融、医疗健康、广告营销、新闻传播等诸多领域,其中也包括在流量经济和内容经济背景下迅速崛起的网络短视频领域。不过,目前对网络短视频中的人工智能技术应用进行专门探讨的研究尚不多见。本文对此进行了梳理和分析,并对实际应用中的问题作了进一步探讨。
一、人工智能技术在网络短视频领域的应用现状
2018年,中国传媒产业总规模突破2万亿元大关,网络视听行业的市场规模首度超过广播电视,网络短视频等新型网络视听模式逐步兴起并占据主流市场。①在此背景下,抖音、快手、美拍等“头部”平台纷纷把人工智能技术视为网络短视频发展的强力助推器,并掀起新一轮行业变革。目前,人工智能技术在网络短视频中的应用,大致可以分为两种:一种是管理层面,被应用于分发推送、内容审核等领域;一种是内容层面,人工智能技术被应用于短视频的内容拍摄、制作和表现的全过程。
(一)丰富内容生产模式
以技术赋能用户生产内容(UGC,user generated content)、丰富内容生产模式,是目前人工智能技术在短视频行业的主要应用形态之一。对于短视频社区而言,不断上线新的玩法是助力内容生产、保证用户留存、适应行业竞争的刚性需求。近年来,利用人工智能技术,一些公司推出了一批“爆款特效”产品:如快手上线的“快手时光机”,能够在十几秒内让短视频中的人脸形象逐渐变成60年后的模样;抖音推出的由今日头条AI Lab技术支持的“尬舞机”“发红包”等特效,可在人脸识别技术的基础上,实现动态图像的转化生产和实景游戏互动,提升产品的沉浸度和趣味性。
在过去,传统的视频制作技术门槛高、耗费时间长,而短视频大大降低了视频内容生产的准入壁垒。通过平台自带的特效或者第三方制作软件,用户可以轻易做到拍摄、剪辑、发布一体化。中国网络视听节目协会发布的《2019中国网络视听发展研究报告》显示,在全国6.48亿短视频用户中,“90后”“00后”是主要忠实用户,高学历、高收入人群的使用率明显高于其他群体。②这些年轻化、富有成长性和创造力的用户群体,对新技术的接受水平高、需求迭代快,而人工智能技术正好能有效满足其需求。对以人工智能为代表的新技术的使用,是短视频平台赋能内容生产的核心手段之一。
在专业生产内容(PGC,professional generated content)领域,人工智能更是有着广阔的发挥空间。目前短视频正处于网络内容生产的风口,在海量视频被创作和输出的环境下,用人工智能实现视频快速剪辑有巨大的市场空间,人工智能技术能够有效缓解高质量内容生产力不足的状况。如2018年“两会”期间,新华智云“媒体大脑”曾在15秒内生成并发布了全球首条关于“两会”内容的机器生产内容(MGC,machine generated content)视频新闻,这条新闻中的舆情分析、图表可视化、视频配音和剪辑均由人工智能完成。现在人工智能技术已逐渐进入新闻、娱乐等各个视频领域,很可能会带来一场新的视频革命。
(二)视频营销和精准推送
人工智能在网络短视频中的初期运用主要体现在营销方面,例如精准推送,即人工智能能够在分析理解用户的年龄、身份、地区等静态数据和使用软件过程中产生的动态行为数据的基础上,进行深度学习训练,从而得到一个用户向量,再根据消费者洞察结合广告内容和智能推理的方法,对消费者进行个性化的广告推荐。
借助人工智能技术,各种新的视频营销方式应运而生。常见的有人工智能场景营销、广告快速植入和功能性互动营销等视频广告类业务,目前均已有较为明确的商业模式。由短视频平台自建或由人工智能公司提供的边看边买类服务,也有着广阔的应用前景。③
随着层出不穷的大、小网红在各大短视频平台入驻,短视频平台展现出了强大的带货能力,抖音为此上线了“商品橱窗”和“抖音购物车”。相比传统的电视广告,短视频的制作成本更低、传播速度更快、受众面更精准,而良好的即时性、互动性更有利于激发受众的购买欲。
正是瞄准短视频营销的红利,阿里巴巴推出了基于图文内容自动生成短视频的人工智能Aliwood,能在對商品各项信息进行多重分析之后,在极短时间内将静态内容动态化,同时进行智能化的配乐和剪辑,最终形成短视频。阿里巴巴通过数据分析发现,商品的展示视频能够有效增加线上的销售量和分享率,如果只靠设计师团队来制作视频将难以满足如此庞大的需求,而人工智能技术正好可以有效解决这一问题。
(三)帮助平台进行内容审核
2019年初,中国网络视听节目服务协会发布了《网络短视频内容审核标准细则》和《网络短视频平台管理规范》,新规出台后,各大短视频平台都相继扩充人工运营审核队伍,由此带来了人力成本的大幅增加。
短视频平台的视频信息存在容量大、内容杂、非结构化的特点,如果全部依靠人工审核,势必消耗大量人力资源,但如果完全依赖现阶段并不完善的人工智能技术,也难免出现误识别内容、误下架作品、误封禁账号的情况。目前业界普遍认为“机器审核和人工审核协作”是现阶段最好的内容把关方式。一些互联网公司为短视频产品建立了人工智能检测体系,以快手短视频为例,当用户上传短视频到快手后端,人工智能会分类提取出视频中的音乐、语言、图像、人脸四个方面的内容信息。这些信息各自独立且有着不同的作用,如通过音乐识别可以对视频配乐进行版权查询,语音被识别转化为文字,则可以帮助人工智能了解视频所表达的大致内容。人工智能在理解直播内容或短视频内容的基础之上,对视频信息或图片信息进行内容判定,检测是否存在违规内容。如果有一定的内容违规可能性,则推送至人工审核,确认存在违规内容后在第一时间进行删除处理。此外,人工智能技术还可被用来做预测分析,即根据用户的历史行为,预测其后续发布内容违规的可能性,在必要时直接封禁用户账号。
二、对网络短视频人工智能技术应用的几点反思
工业文明时代以来,技术作为实现人的目的的一种手段,始终处在不断地被开发和迭代进化的过程中。一种颠覆性技术的诞生总是伴随各种各样的争议,技术是否会广泛地取代人类劳动,是否能满足现有需求而不产生新的问题?在对人工智能技术广泛应用于网络短视频保持乐观鼓励态度的同时,也需要审慎冷静地反思。
(一)内容审核短板:不易发现版权侵权问题
近年来,网络短视频发展迅猛,然而短视频内容的生产中却存在着 “搬运工”和“剪刀手”等版权侵权现象,相应的版权诉讼与法律纠纷也时有发生,已经成为网络短视频发展过程中不容忽视的问题。2019年9月,北京互联网法院正式成立,开庭受理的第一案是抖音对百度旗下“伙拍小视频”未经抖音原创作者“黑脸V”许可,擅自将其作品上传至“伙拍小视频”平台并提供下载服务的诉讼。④
对于内容生产领域而言,版权保护是重中之重。目前,网络短视频的侵权方式以“将长视频剪切为短视频,将短视频拼凑成长视频”为主,同时也有伪装成自媒体抓取、偷录影视资料、更改视频元素等手段侵权的。侵犯版权的问题如果不能得到解决,短期内会有损原创者们的创作热情和合法权益,长此以往则会阻碍行业可持续发展。
在网络内容领域,相较于内容生产、内容分发等产业技术的飞速发展,内容审核技术还不够成熟,这一点在人工智能技术的运用中比较有代表性。传统的新闻平台以文字为主要内容,而网络短视频则以音频、视频为主要内容,审核难度远远超过前者。而技术审核仍处于“弱智能化”阶段,主要采取跟随监管技术,对违法违规信息主要进行强制删除、封号处理,难以满足事先监管和信息把关需求,导致在内容管理上滞后和低效。
目前的人工智能尚处于“弱人工智能”阶段。⑤以判断短视频侵权为例,人工智能主要依靠大量的样本识别和训练来掌握这项技能。但当前现有的网络短视频内容数量庞大、质量良莠不齐,加之短视频侵权行为的界定不甚明确,人工智能很难做到准确判断,难免存在出错的可能。甚至在培训人工智能的过程中,也可能存在未经版权人许可擅自使用作品数据的侵权行为。⑥因此,目前人工智能技术在短视频版权保护领域,尚只能起到一定的辅助作用。
(二)短视频娱乐泛化和艺术性的消解
当前的网络短视频已经从“看视频”“拍视频”进入到“玩视频”的阶段,人工智能技术进一步简化了短视频的创作方法,这在一定程度上加强了短视频平台的“玩具”和“游戏”属性,从而导致“人人皆可拍,人人都在玩”局面的出现。赛斯·吉丁斯(Seth Giddings)在《游戏世界》中谈道:“虚拟媒介带来了新的技术领域和有生命的实体,以此实现日常生活的分层和增值。”⑦伴随智能手机和移动互联网的发展,虚拟媒介和互联网媒介逐漸成为人们日常玩耍的主要“场所”之一。随之兴盛起来的网络短视频,也演化为人们日常休闲的一种新手段。
网络短视频的娱乐功能被放大的背后,是网络短视频创作领域艺术性的缺位。人工智能虽然可以代替人类完成一些程序化的工作,但无疑缺乏感知和理解人类复杂的情感世界的能力,依赖人工智能提升受众的审美品味和艺术趣味是不切实际的。
抖音早期定位为“年轻人的音乐短视频创作分享社区”,技术高超的拍客们熟练运用各种拍摄手段和剪辑技巧制作了大量短小精悍的音乐短视频。如今,这类兼具艺术性与趣味性的音乐短视频已退出主流市场,某种程度上抖音逐渐转化为大杂烩式的短视频流量平台。短视频的门槛逐渐走低,简单化、同质化的创作倾向一定程度上制约了优质短视频内容的产出。在提升短视频的艺术性上,相较于人类所具有的非凡的想象力、源源不断的创造力、充满感性的能量,人工智能所能做的还相当有限。“在人工智能影像艺术所创造的一个个视觉奇观中,原本属于艺术的美感不再独立存在,最终沦为被审视的对象。”⑧
当下,我国以网络短视频为代表的网络视听行业呈现出较强的发展势头,这对网络内容生产起到了丰富表现形式、拓宽行业业态、优化产业生态的作用。但同时,网络短视频的生产技术主要由大型互联网公司垄断,一些企业在产品研发上奉行“技术中心主义”,使得技术成为资本追逐的核心目标。我们既要看到人工智能等技术给网络短视频带来的巨大影响和变革,也要对技术的全面介入持冷静和审慎的态度。人工智能技术能够从事人类某些费时费力的简单劳动,但存在一定的极限。如果放任网络内容的机械化生产,有可能导致加剧人的思维惰性、消解人的审美品位等负面作用。而片面追求数量和速度,舍弃质量和深度,也会产生文化产品千篇一律的弊端。
(三)人工智能技术带来的隐私保护难题
网络短视频涉及的隐私问题较为复杂。首先是肖像权隐私和面部生物识别信息安全问题。2019年一款名为“ZAO”的AI换脸短视频软件曾在社交网络引起一阵“换脸”热潮,但不久便因可能被用于非法造假、涉及侵犯公众人物肖像权和影视片段的商业版权、用户隐私协议不规范等问题被工信部要求自查整改。⑨可以看到,在人工智能技术的辅助下,我们已经从“P图”时代进入“P视频”时代。结合短视频成本低、可大规模生产的特点,如不加以严格管控,大批来路不明、真假难辨的短视频将进入网络平台并被广泛传播。以肖像权为代表的隐私权会成为焦点问题,同时,假新闻、假视频将更易于制作,甚至形成“AI换脸”的黑色产业链。
其次是非法收集与用户使用短视频应用无关或弱相关的个人信息。当前,利用人工智能收集个人信息已呈现出全面化、精细化、隐蔽化的特点。从人工智能技术在网络短视频的应用中,我们可以窥见技术给个人隐私保护带来的前所未有的挑战。对于拥有海量内容和受众的各大短视频平台而言,算法推荐是其生存之道。但对于受众而言,算法推荐则有可能将他们置于人工智能极为隐蔽的凝视和控制之中。当前主流的算法推荐模式包括基于用户行为数据的协同过滤、基于内容标签和用户标签的精准匹配和基于相似语义的内容配对。这些智能化推荐的达成,均建立在对用户喜好、行为数据乃至社交圈层的分析之上。这意味着用户的每一个意图、每一次行为,都在无形中被人工智能所捕获。同时,人工智能给用户“贴标签”“立人设”无疑也有物化用户之嫌。
三、相关对策与建议
针对上述问题,本文认为可考虑借力区块链技术加强版权保护,同时,秉持技术理性的态度,改进算法,并推进隐私多元共治,促进行业良性发展。
(一)借力区块链技术加强版权保护
区块链是一种基于数理逻辑建立的信用共识技术,具有去中心化、公开透明、开放共识、安全可靠的特点。在网络短视频领域,利用区块链技术可以为短视频的视频、音频、图片等所有数据加盖时间戳,以此来证明这些数据在标记前已经存在。同时将这些数据打包存储,使用授权都交由原作者管理。相较于人工智能技术,区块链技术在作品版权和知识产权保护上具有明显优势。
一是安全性强。以区块链应用最广、作为比特币底层技术的PoW(Proof of Work)共识机制为例,只有同一区块内50%以上的用户认可之后,某一用户的操作才会被允许和记录;换句话说,只要进行某种网络破坏行为的人员算力不超过全网总算力的50%,其破坏行为就无法达成。⑩目前也已有学者提出在数字版权保护领域,可以选择成本更低、效率更高的DPoS(Delegated Proof of Stake)共识机制。
二是权力回归。有了区块链技术的加持,对作品版权进行授权和交易的权力完全归版权人所有。授权是指版权人享有作品的使用权,只有经其允许才能将使用权与他人分享。交易是指所有权的转移,版权人确认交易后立刻获得资金,实现知识产权变现。且这些过程完全公开透明、没有第三方介入并全网广播,确保透明可靠。
三是侵权检测。根据平台注册信息自动检索内容,对已经注册或上传的内容进行检索,杜绝相同内容重复出现的情况,起到保护原创的作用。同时,区块链系统会保证版权信息、版权授权信息和版权交易信息的绝对真实,杜绝信息伪造的情况发生。
四是智能合约。对于短视频等数字内容作品而言,各國版权法中的“合理使用”边界存在一定的争议。本质是计算机程序的区块链智能合约,能够针对不同的数字作品分别制定条款,让管理版权和许可更加灵活便捷。
通过对比区块链技术和人工智能技术判断、审核视频内容是否侵犯版权的方式,可以发现,在短视频版权保护方面,区块链技术有着包括人工智能技术在内的其他技术和审核方式所无法比拟的优势。区块链技术通过给原始视频加盖时间戳等方式,可以从源头上保障作品版权。如果能够将区块链技术进一步推广应用,那么短视频元素复杂、版权保护难的问题有望得到解决。
(二)保持技术理性,人机协同共存
前文提到,从人工智能技术在短视频内容生产领域的应用来看,存在娱乐泛化、艺术性消解等问题的本质是人工智能对人类作为创作主体的地位的挑战。网络短视频作为一种新型的网络视听内容,其创作过程是人类主导的智力活动。从选题和剧本创作伊始,就需要人类源源不断的想象力和创造力的投入。从创作原理来看,来自人工智能的创作更多是通过数据与算法在模仿人的创作模式。“它们的创作行为,是在人的指令下完成的一系列计算行为。”也就是说,现阶段的人工智能技术所能做到的艺术创作是一种基于对人类创作大量学习下产生的固定思维的产物。
在短视频的内容生产方面,人工智能技术更多的应是“赋权”而不是“接管”,即应始终保持人的创作主体地位,而不是强制将用户的灵感来源和创作手段局限于预先设定的简单模式内。从短视频兴起以来,泛娱乐化内容井喷,追新求异的价值观形成已久。技术带来的价值偏向,一定程度上也是部分平台方一味“求新求异求快”,而导致与广大用户关系断层的反应。为博眼球,以人工智能技术为噱头的产品注定无法经受住受众和市场的考验。
尽管人工智能不可能也没有必要完全自主地进行创作活动,但已有研究证明,通过有意的参数设计,人工智能能够“创造性”地完成人类赋予的艺术创作任务。2017年美国罗格斯大学的研究团队研发了能够进行艺术绘画创作的名为“创意对抗网络”(Generative Adversarial Network)的人工智能系统,并通过了图灵测试就是一个很好的例证。有学者认为,人工智能艺术的魅力正在于“机器可以产生一种创造力,尽管这种创造力是由人类触发的,根植于一种共生的伙伴关系中”。
自人工智能的概念被提出以来,人类与人工智能始终处在协同共生的状态中。智媒趋势下,人工智能进入网络内容生产的各个环节已是必然。人工智能技术应用于网络短视频中,帮助平台进行内容审核、为用户创造更多样化的内容玩法,都是对“人机交互”水平的提高。人工智能扮演了合格的“辅助者”“延伸者”的角色,并帮助人们不断探索更多的创造性的可能。保持对技术的理性,合理看待人工智能技术的发展与应用,能够使我们在捍卫主动权的同时,与人工智能协同共存、共同进化。
(三)健全法律法规和行业政策,优化算法,推进隐私多元共治
在人工智能和大数据的时代,隐私保护已成为一个世界性的难题。欧盟最早完成统一立法保护公民隐私,而美国则更强调市场的力量,试图以法律和商业并举来形成网状保护。我国目前的隐私保护法律体系还不够健全,对信息隐私的保护还不够完善。目前国内相关部门也在广泛征集意见,积极推动个人信息和数据安全相关法律法规的尽快出台。不过,大数据时代的隐私保护不能仅靠行政和司法力量,平台方、用户、开发方和其他利益相关主体,如广告商、科研人员等,也应一起参与到隐私保护的共同治理当中。
针对网络短视频中的隐私侵权现象,在立法方面,应充分关注尊重用户的基本权利,结合短视频产品的特点,应考虑实行隐私分级制度,设置个人敏感信息禁区,并加大对侵害个人隐私行为的惩戒力度。对于平台方而言,应着力于增强隐私保护政策和用户服务协议的可读性和透明度。积极营造公平透明、可预期的应用环境,做到条款合理、更新及时、通知到位,切实维护用户的个人利益。对于用户而言,应强化信息安全意识,妥善使用短视频软件,管理个人数据,谨防信息盗用等欺诈行为。对于开发商和其他利益人员,应从算法源头进行隐私保护治理。国家网信办已制定《网络信息内容生态治理规定》,并从2020年3月1日起正式执行。该规定“鼓励网络信息内容服务平台坚持主流价值导向,优化信息机制”,并强调“网络信息内容服务平台采用个性化算法推荐技术推送信息的,应当设置符合规定的推荐模型,建立健全人工干预和用户自主选择机制”。优化算法推荐,强化价值观引领,拒绝以所谓技术中立之名逃避社会责任,既是对人工智能决策权的限制,也是人类作为数据主体的权利回归。
目前,学术界对互联网隐私问题的研究虽多,但专门针对短视频用户隐私问题所做的研究却十分少见。而事实上,短视频无论是产品形态还是生产模式与商业模式都颇有其自身特点,因此在隐私的管理与治理上也应有不同于其他应用领域的办法。比如,艾尔哈德(Elhadad)等人从计算机技术角度,提出基于数据隐藏原理的视频隐私隐藏框架,这种技术要求只能在对原有图像识别过程完成后才能嵌入隐私信息,然后再由隐私所有者自行检索还原。马吉塞特(Madhisetty)和威廉姆斯(Williams)则从认知心理学角度,提出了一套适用于短视频平台的社交媒体隐私管理的关键绩效指标,区别于传统的点击量、留存率等。这套指标包括信息控制、涉敏标记、镜头光圈、默会信息等8个部分,帮助平台从用户、设备、技术等不同层面对隐私保护情况进行管理评测。
四、结语
布莱恩·阿瑟(Brian Arthur)在《技术的本质》一书中谈到,主导技术发展的力量,一是组合,二是需求。阿瑟所说的组合是指“现有技术体供给新技术的能力,无论是将现有的零部件进行总成,还是用它们捕获现象”。人工智能技术和短视频应用的组合,催生了网络短视频这种新型视听模式的又一步进化。可以想见,在不远的未来,随着VR、5G等技术的成熟,越来越多的新兴技术手段将被应用于网络短视频领域,与原先的技术组合,形成新的技术手段和潮流。
综上所述,人工智能技术在网络短视频当中的应用已是大势所趋,随着技术的不断发展和商业模式的探索应用,人工智能将会渗透到短视频领域的更多方面,为人们带来不一样的体验。如何利用人工智能技术去为短视频行业开创一个更有创意、更具效率的发展形态,如何解决短视频行业在人工智能技术运用过程中出现的种种问题,还需要政府、学界、业界、公众等多方主体的更多探索与共同努力。
注释:
①叶丹:《短视频日活用户将达10亿,商业化加速》,《南方日报》2019年8月30日。
②《〈2019中国网络视听发展研究报告〉在蓉发布》,中新网,http://www.chinanews.com/cj/2019/05-27/8848318.shtml,2019年5月27日。
③《2019年中国人工智能产业研究报告》,艾瑞咨询,http://report.iresearch.cn/report_pdf.aspx?id=3396,2020年1月2日。
④《北京互联网法院首案今日开庭》,新华网,http://www.xinhuanet.com/legal/2018-10/30/c_1123635727.html,2018年10月30日。
⑤舒跃育、汪李玲:《人工智能发展处于弱人工智能阶段》,《中国社会科学报》2017年4月25日。
⑥卢炳宏:《表达型人工智能版权合理使用制度研究》,《现代出版》2019年第4期。
⑦〔英〕赛斯·吉丁斯:《游戏世界——虚拟媒介与儿童日常玩耍》,徐偲骕译,上海文艺出版社2019年版,第201页。
⑧吴文瀚:《论人工智能的话语实践与艺术美学反思》,《现代传播》2020年第4期。
⑨《工信部就“ZAO”App网络数据安全问题开展问询约谈》,新京报网,http://www.bjnews.com.cn/news/2019/09/04/623089.html,2019年9月4日。
⑩《区块链的共识机制是什么?》,简书,https://www.jianshu.com/p/82314b7a4b05,2019年3月31日。
Yuanjun Ding,Haibo Pu,Yu liang,Hongjie Wang.Blockchain.Technology in the Registration and Protection of Digital Copyright[C].International Conference on applications and Techniques in Cyber Intelligence ATCI 2019:608-616.
張冰清、李琳:《基于区块链技术的数字版权利益平衡》,《中国出版》2019年第11期。
彭兰:《智媒趋势下内容生产中的人机关系》,《上海交通大学学报》2020第2期。
汤克兵:《作为“类人艺术”的人工智能艺术》,《西南民族大学学报(人文社科版)》2020年第5期。
王敏:《大数据时代如何有效保护个人隐私?——一种基于传播伦理的分级路径》,《新闻与传播研究》2018年第11期。
Elhadad,A., Hamad,S., Khalifa ,A. et al.High capacity information hiding for privacy protection in digital video files[J].Neural Computing and applications,2017(28).
Madhisetty,S.& Williams MA. Managing Privacy Through Key Performance Indicators When Photos and Videos Are Shared via Social Media[C].Science and Information Conference SAI 2018:1103-1117.
〔美〕布莱恩·阿瑟:《技术的本质:技术是什么,它是如何进化的》,曹东溟、王健译,浙江人民出版社2018年版,第192页。