APP下载

人工智能助推视听产业创新发展

2018-08-24牛禄青

新经济导刊 2018年1期
关键词:人工智能机器人智能

牛禄青

当前,视听产业正面临制造大升级、应用大升级和消费大升级的良好发展机遇;同时,也面临消费者过度聚焦小屏、远离大屏的困境,以及由此带来的大屏更新换代周期过长、超龄服役等问题。

解决这个问题要从满足“人民日益增长的美好生活需要”出发,主动打破“低质低价低效”的恶性循环,通过落实供给侧改革,加快人工智能、4K超高清和环绕立体声技术的普及,并尽快补齐4K内容的短板,吸引用户重新回流客厅。

视听产业是电子信息产业的“火车头”,通过国家产业政策的支持和市场主体的创新竞争,通过产业链上下游协同努力,中国有望从视听产业制造大国、消费大国,发展为技术创新强国和品牌服务强国。

事件

国内首款视听机器人诞生

2017年12月12日,由海美迪、腾讯云小微、腾讯视频、哈曼卡顿、海思共同打造的中国智慧家庭领域首个视听机器人正式面世。作为在各自领域占有举足轻重地位的巨擘,将各自在人工智能领域探索的技术融合到了视听机器人身上,它所蕴含的诸多功能突破了用户对于人工智能产品的固有印象。

海美迪视听机器人完整接入腾讯云小微智能语音服务平台,陪护老人、陪伴儿童、娱乐家庭等功能一应俱全,是一名正儿八经的家庭智能语音小助手。腾讯云小微负责人毛华表示,作为腾讯云全力打造的智能服务开放平台,腾讯云小微可以让硬件快速具备听觉、视觉感知能力。同时,小微的Skill内容生态将赋予硬件更多的能力扩展,如娱乐、物联、助手等,从而构建一个从云到端的“智能云生态”。

从功能上看,海美迪视听机器人集摄像头、音箱、机顶盒于一体,涵盖了视频通话、家庭看护、超高清4k播放、智能音箱、家庭物联中控的功能,这种新型产品形态在国内还是第一次出现。

此外,海美迪视听机器人集成海思Hi3798高级多媒体处理芯片方案以及哈曼卡顿音效。海思全4K芯片解决方案,以高效的运行效率和开放的开发接口能力,为视听机器人带来极佳的语音识别速度和优秀的音频处理效果。同时,海美迪视听机器人支持4K HDR高动态范围技术,运算速率达到15000DMIPS,为用户提供超凡4K画质。每一种类型的电影大片,视听机器人都能带给用户身临其境的观影体验。在音效方面,由哈曼卡顿专业团队根据箱体特性量身定做五大扬声器单元,采用美国德州仪器原厂功放。在同类产品中,视听机器人的音箱容积最大、低音最强。

海美迪视听机器人也有一双灵敏的耳朵,采用科胜讯经典双麦克风阵列,结合专业硬件DSP音频处理系统,抗干扰和灵敏度极高。5M半径精准拾音范围,用户可在客厅的任意角度,语音指挥这个小助手。

在内容上,视听机器人搭载腾讯云小微智能语音服务平台,同时内容上齐集腾讯视频、QQ音乐、企鹅FM等海量音视频资源。不仅能与用户进行全方面的交互体验,还能够担任全能家庭语音助手,实现远场语音点播影视、点播音乐、视频通话、智能看护、生活助手、物联家电等多种功能。

想看电视剧、电影大片、娱乐节目、少儿节目,不需要拿着遥控器搜索寻找了,那样太麻烦。现在,将海美迪视听机器人连接电视,坐在沙发上,只需说一句:“你好小微,我想看人民的名义”,电视屏幕立刻就跳到播放画面,并且能够直接跳到上一次观看的那一集、那一段,断点续播就这么方便!這种追剧体验是不是很神奇?

宝宝在房间里睡觉了,年轻妈妈忙里偷闲想追个剧,又担心宝宝会踢被子,一定要带个ipad守在孩子身边吗?NO!放心坐在客厅里追剧吧,只要对视听机器人说:“你好小微,打开宝宝看护摄像头。”在追剧的同时就能小窗口实时观看宝宝的睡态。

年迈的父母远在家乡,想看孙子,又不会用智能手机,怎么办?海美迪视听机器人同时也是一台视频通话机。无需下载辅助软件,也不需要购买两台相同的设备,通过海美迪视听机器人,家里的电视大屏就可以直连手机QQ。以后父母想看孙子了,直接说:“你好小微,给儿子打电话”,即刻就能通过电视与孩子视频。视听机器人的摄像头有大广角镜头,客厅情况一览无余。宝宝可以一边在客厅玩耍,一边跟奶奶或妈妈撒娇聊天。

忙碌了一天,晚上回到家中,很累,就对海美迪视听机器人诉说吧。无论是“你好小微,心情不好来首歌”,还是“你好小微,放我喜欢的歌”,它都能投其所好,为每一位用户推送适合的音乐。海美迪视听机器人内置QQ音乐,1700万正版音乐曲库任你点播,随心操纵,想听的流行乐、轻音乐、古风、英语、粤语应有尽有,享受高品质正版音乐,听你想听的歌。

个性电台、有声读物、听新闻、查天气、英语翻译、闹钟提醒、趣味聊天等功能一应俱全。海美迪视听机器人身上还有许多可以帮助孩子们学习的少儿应用。视听机器人可以为孩子讲述绘声绘色的童话故事,借助腾讯云小微百科,海美迪视听机器人还能为孩子们解答生活中的各种百科问题。

背景

人工智能风口下的视听产业

2017年7月,国务院印发《新一代人工智能发展规划》(以下简称《规划》),这是首部国家层面的人工智能发展规划。《规划》明确了中国新一代人工智能发展的战略目标:到2020年,人工智能总体技术和应用与世界先进水平同步,人工智能产业成为新的重要经济增长点,人工智能技术应用成为改善民生的新途径,有力支撑进入创新型国家行列和实现全面建成小康社会的奋斗目标。

到2025年,人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平,人工智能成为中国产业升级和经济转型的主要动力,智能社会建设取得积极进展。

到2030年,人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心,智能经济、智能社会取得明显成效,为跻身创新型国家前列和经济强国奠定重要基础。

当前,新一代人工智能正进入产业化应用阶段,智能家居并呈加速发展态势。2017年OTT大屏智能终端在家庭的覆盖率达到45%,据预测在2020年大屏智能终端的覆盖率将达到72%,终端数量将突破4亿,为家庭互联网时代带来扎实的基础。

科技部战略研究院副研究员李修全在2017(第十三届)中国音视频产业技术与应用趋势论坛(AVF)论坛上表示,人工智能具有高度交叉的技术和产业属性,将与各技术领域深度融合。通过培育发展人工智能新兴产业,促进产业智能化升级,将为我国经济发展注入新动能,开拓出新的广阔的经济增长空间。

在AVF论坛上,厂商以人工智能、认知计算等新技术运用为支撑,提升语音操控技术,让交互变得更加智能。随着语音搜索、自动推荐及视觉图像识别等技术的应用,人工智能与家庭终端设备的结合也日渐普及。

TCL发布的人工智能电视新品,围绕着更加“懂你”的科技变革,电视在智能化和人性化方面不断提升,以至于现阶段智能电视卖点都聚焦在人机交互、语音识别、智能互联等功能上,进入以人工智能电视为核心卖点的新阶段。TCL多媒体产品中心X线产品总经理卜海峰表示,目前整机厂商所使用的底层AI技术不尽相同,因此企业需要做的,是根据使用场景来进行调度,实现用户的差异化体验。

自2016年长虹推出全球首款人工智能电视后,长虹智能转型也步入人工智能新阶段。作为全球首款声纹识别人工智能电视,长虹Q5K应用国际前沿的I-vector技术为声纹建模,识别率超过90%。长虹Q5K采用集成式阵列麦克风,实现5米范围内的远场语音采集,通过13万个语义关键词词条,实现角色搜片、精准纠错等模糊搜片,为用户提供更流程的交互体验。

随着家庭视频、游戏、社交服务的快速增长,对于电视直播视频的解决方案以及视频内容的分发能力提出了更高的要求。早在2016年,Yi+就针对这一难题给出了解决方案,基于对图片视频图像识别、大数据、用户画像等信息获取、学习与分析,为用户提供更具人性化与个性化内容推荐等扩展内容的一系列定制化增值服务——大屏AI助理,取得了较多的成果转化和商业运用,成功吸引如阿里、华数等众多视频平台和广电、OTT市场等深度合作,服务了海量用户。

2017年12月1日,在第五届全国网络视听大会短视频高峰论坛上,阿里大文娱集团联合阿里巴巴达摩院共同发布了鲸观全链路数字版权服务平台。

据悉,鲸观平台将为视频行业提供全链路数字版权服务,这也是达摩院技术首次在文娱行业落地的成果。未来,鲸观将在视频智能编目、版权保护和商业变现等各个环节上,盘活行业存量并创造行业增量。

阿里大文娱移动事业群轮值总裁黄浩表示,短视频全球化的风口非常迫切,将是中国企业与全球玩家的竞争。但是,在短视频行业增长迅猛的同时,也存在一系列瓶颈待解,如产能不匹配、盗版严重、商业模式单一等。

而鲸观平台搭载的达摩院iDST(数据科学技术研究院)人工智能技术,实现了视频智能编辑,通过对视频内容各个维度的分析,打上两万余种标签,同时利用知识图谱对标签进行多维度编目。有了标签,视频素材就容易被检索。这样一来,数亿行业闲置的视频资源将被重新激活,实现二次甚至多次使用价值。

智能编辑在打标的同时,还会在音视频素材上抽取“指纹”,让音视频素材在全网范围可追溯,且实现毫秒级速度支持百亿级指纹检索,侵权盗版无处可逃。音视频指纹技术不仅大大降低了视频版权监控取证的成本,还可被用于广告分成等多種业务场景,助力宣发。

据阿里巴巴达摩院iDST首席科学家和副院长任小枫介绍,目前,5分钟时长的视频经过上述全链路处理可在10秒内完成。基于达摩院技术,鲸观未来还将在视频AI上进一步发展,实现视频素材通过创作交互平台快速智能生成新内容。

焦点

内容安全是视听产业首要挑战

近年来,网络视听技术迅速发展壮大,广播电视媒体与互联网新兴媒体融合发展,经过多年探索和实践,虚拟现实、大数据、人工智能等新技术正驱动网络视听行业深刻变化、快速发展,确立差异化市场地位的同时,满足了广大人民多元化的精神文化需求。但是,网络视听行业目前也存在一些突出的问题:淫秽色情现象、网络暴力、网络谣言、侵犯公民个人隐私等迫切需要各方通力协作来解决。

当下,安全播控内容审核的范围扩展到文字、语音、图片、视频、直播等,几乎覆盖了移动互联网时代的所有产品。一个显著的特征就是人工智能在内容审核领域的应用。

视听行业聚集了大量的内容和用户,特别是具有实时互动特点的直播、短视频、在线音视频,安全问题是绕不过去的一个坎儿。没有信息内容、用户数据的安全保障,良好的互动和用户体验也就无从谈起。

网易云副总经理周森指出,视听产品在研发中通常会遇到3个挑战:一是成本方面,研发很贵,网络带宽很贵,在内容安全上的投入也很大,成本很高;二是交互方的需求多样化,产品要快速迭代升级,对技术要求高;三是在呈现效果上,画面要流畅,交互体验要好,内容安全保障要好。这都有赖于通过结合人工智能、大数据、云计算等相关技术去实现。

据网易杭州研究院执行院长汪源介绍,在内容安全领域,网易云做了非常多的防护措施,比如文本的识别、图像的鉴黄、视频的过滤、暴恐信息的识别等,同时最大化地保护用户隐私。“用户数据在网易里是没有任何一个人能够获取的,即便基于我们业务的需要访问用户数据,也需要经过多个部门的多重加密解密,以防范任何情况下出现问题。”

网易云针对视听行业的技术性解决方案,除了在互动功能层面提供直播、点播、聊天室、在线音视频技术外,重中之重是依托强大的云计算基础设施,借助人工智能过滤有害信息,保障内容安全。

“网易云在视听内容安全方面提供了非常丰富的场景,包括新闻内容、聊天室、评论、直播、弹幕、短信、签名等,利用网易运营团队和内容安全、审核团队的专业审核标准和分控体系,我们将有害信息分成八大类20多个场景,并重点研发了人工电视墙系统。”周森说。该系统针对以往通过截图审核难以识别一些违法违规场景的问题,增加了人工智能识别技术,可对有嫌疑的直播间进行智能排序。“一旦识别出来将对这些直播间重点标注,以便审核人员重点关注,发现违规行为马上进行处罚。”

以秒拍、小咖秀、一直播三款热门产品在移动视频领域形成产品矩阵生态的一下科技,与网易云合作正是看中了其20多年的运营经验及海量数据。一下科技总裁陈太锋表示,反垃圾、有害信息是一个不断抗衡的过程,目前一下科技已建立了近800多人的团队,视频方面也建立了自己的AI团队,通过视频识别、视频指纹等方式对色情暴恐等内容进行实时监管。“一下科技采取这样的方式包括实行最严格的实名认证体系,就是希望把真正有价值的内容留下来。”

图普也是一家基于深度学习技术、多维度解读图片和视频信息、将图像识别技术应用于企服务领域的公司。“鉴黄”是图普最为人熟知的标签,即通过对海量图片、视频的分析学习后,代替人工自动审核色情内容,这可以为企业节省巨额成本。

在電视内容审核方面,Yi+是国内首家应用人工智能技术实现电视、OTT视觉识别交互的公司,2017年同中信国安广视达成合作,Yi+成为国内第一家实现毫秒级完成实时视频直播内容识别的公司。Yi+视频图像分析识别是基于人工智能计算机视觉技术,对媒资库内选定视频“黄”“暴”特定信息自动进行识别,生成标注信息供安播团队筛选;特别标注“露点”“血腥”镜头;对特定敏感人物(如恐怖分子头目)在毫秒级中快速自动识别,供安播团队筛选。

比如当儿童独自观看视频时,电视机镜头识别儿童后,开启“安全播控”模式,自动屏蔽黄暴内容;在此基础上,基于识别不同年龄层的人群会推荐相关内容,当识别到儿童之后,电视会推送动画或者儿童教学相关的内容,家长可以通过语音/体感唤起AI助理帮助识别场景相关内容介绍。

启示

人工智能为视听产业带来新动能

人工智能作为新一轮产业变革的核心驱动力,将进一步释放历次科技革命和产业变革积蓄的巨大能量,并创造新的强大引擎,重构生产、分配、交换、消费等经济活动各环节,催生新技术、新产品、新产业、新业态、新模式,引发经济结构重大变革,深刻改变人类生产生活方式和思维模式,实现社会生产力的整体跃升。

爱奇艺创始人、CEO龚宇表示,人工智能技术的崛起,将在未来对流量、收视或者票房预测、内容审核、广告投放等视听领域多方面产生重要影响。同时,在新使命方面,龚宇强调,用符合主流价值观的网络原创作品满足人民日益增长的美好生活需要,是视听行业未来非常重要的使命和任务,并认为,优秀人才、加大投入和突破性的创新力三大要素,会成为加快视听行业完成使命的关键。

比如流量、收视或者票房预测对创作阶段有非常重要的现实意义。指纹植入视听作品,在防止盗版、追查盗版、排除重复性的视频等方面,可以大幅提高工作效率。再比如审核,按照国家的法律法规,有些内容是不能向公众传播的,互联网的海量信息对于人工审核来讲,整合起来不但成本高,更大的麻烦是准确率很差,会丢掉一些不应该放弃的内容。通过人脸识别、情景识别等办法可以帮助管理者提高审核的效率和准确率。还有剪辑、缩略图、标签标注等方面,都能提高准确率和效率。

大数据标签主要用于短视频和直播平台,系统会通过对海量的标注过的数据的学习,根据主播的行为、场景、人物风格、年龄、性别等,自动为当前直播建立标签。例如,一个喜欢做嘟嘴表情的年轻女孩,会有很大可能被打上“萌妹子”的标签。而通过对人工标注的系统的学习,人工智能甚至可以判断主播的颜值。

通过应用人工智能技术,分发和播放可以实现个性化推荐,广告可以实现精准投放、情景化投放。对于做视频推荐来说,这些基本符合主流审美标准的标签已经足够了:新用户注册后,直播平台可以根据该用户选择关注的标签,在他的首页呈现相应的直播;直播平台还可以根据颜值和热门等综合因素,在首页推荐直播内容;另外,当用户关注的主播不在线时,系统还可以推荐一些和他关注的直播类型相似的主播。

此外,用户可以直接根据标签去搜索。例如用户喜欢唱歌的、场景在KTV里的直播,都可以根据相应标签搜索。图普科技CEO李明强表示,仅这个推荐功能,应用比较好的平台,可以使新用户的留存增加一倍以上;对老用户,也能使其停留时长至少增加30%~40%。对短视频和直播平台来说,留存增加意味着用户体验的提升,更重要的是,广告、打赏等收入会得到显著提升。如果说之前的内容审核是节约人力成本,为企业省钱的话,视频推荐则是实打实地帮企业赚钱。

在新时代背景下,视频化是大势所趋,网络视频也不再是单纯的内容生产与传播,而更是一种融合各产业的媒介与渠道。在第五届中国网络视听大会上,从VR、AI、无人机到智能设备的视频连接,视频+电商、视频+投资、视频+教育、视频+大数据、视频+云服务等,无一不预示着“智慧视听”将在未来经济社会中发挥着重要角色。

猜你喜欢

人工智能机器人智能
2019:人工智能
智能前沿
智能前沿
智能前沿
智能前沿
人工智能与就业
数读人工智能