推动人工智能落地助力广电行业发展
2024-01-30方世彤
方世彤
1月9日—12日,2024年国际消费类电子产品展览会(CES)在美国拉斯维加斯举行,放眼望去,几乎都是AI(人工智能)。ChatGPT掀起的人工智能浪潮让全球激动不已,AI正在创造新的、非凡的经济价值,人工智能时代已经悄然来临。
我接触人工智能算是比较早的,在英国学习的时候,我的舍友就是研究人工智能的博士后,经常会给我普及一些高科技知识。他的研究方向是通过算法让摄像头在低照度、低分辨率,甚至画面扭曲的情况下识别人脸。这在刑侦领域是个突破性技术,因此在20年前他就获得了美国警方和英国警方的学术资助。人脸识别技术并非生成式人工智能,但也是人工智能的重要基础项目,它关乎看的体验(视觉)。
十年前,我参加浙江卫视一位知名主持人的专家研讨会,他是一位以犀利评论出名的主持人,尽管普通话不标准,但深得浙江本土观众乃至全国观众喜爱。研讨会上一位来自浙江大学的老师说,他们是研究自然语言的,可以将这位主持人作为样本,深入研究其语言艺术。事实上,正是这种自然语言研究促使了GPT(生成式预训练Transformer模型)技术的出现。这是关乎说或者听的体验(听觉)。
当下,传统电视要做的事情无非为观众提供高质量的视听享受,人工智能助力传统电视发展是自然而然的事情。虽然观众尚未有直观感受,但AI已经在广播电视领域默默地发挥着作用。
人脸识别技术经过数十年发展,在广电行业中有着不少应用案例。我曾经和某国际公司共同参与此类技术在电视台的落地工作。画面识别是一项高科技技术,特别是算法。但是聪明的人会在应用中简化或者用其他技术代之。早期的画面识别技术不是通过看实现的,而是通过听,因为音频文件远小于视频文件。后来,人们发现听不如直接在源文件中放入水印,这个水印人看不到,也听不到,但是机器能够识别,文件也非常小,所以反应速度相当快。后来还出现不少利用这一技术来实现手机与电视交互的公司,直到今天,仍有许多公司应用着这些非AI却能达到AI效果的技术。人工智能或许并非唯一答案,但首先人类要把它视为一种技术,并驾驭它。
2023年12月27日,《纽约时报》正式起诉OpenAI和微软,指控这两家公司未经许可使用其数百万篇文章用于训练GPT模型,创建包括ChatGPT和Copilot在內的AI产品,要求他们对“非法复制和使用独特价值的作品承担数十亿美元的法定和实际损害赔偿”,还要销毁所有包含《纽约时报》版权材料的模型和训练数据。
这起诉讼案将深远地影响生成式AI的未来。目前来看,被控方律师以“合理使用范畴”应对。生成式AI技术需要对大模型进行大数据的训练,也就是会喂给计算机大量的已经存在的内容。计算机可能修改后使用,也可能直接引用,这是机器深度学习的结果,人无法强迫它不引用原来的数据,因此就有可能会造成“侵权”。在影音方面,生成式AI同样面临侵权问题,虽然人工智能厂家大量采购音视频文件建立自己的数据库,但并不代表大模型不会引用某些未经授权的影视内容。
这种错综复杂的问题需要耐心地抽丝剥茧,在没有案例参考的情况下,《纽约时报》的诉讼短期内未必会有结果。但是,这也是人工智能发展道路上必须要解决的问题。2024年,希望更多业内人士在这方面多做讨论,建立合理应用的规范。
回顾过去一年,许多电视台都开始起用数字主持人,还有大量人工智能加持的二次元虚拟主播,但截至目前,尚未出现一位能够深入人心的数字主持人或虚拟主播,这方面仍有待业界持续探索。就当下而言,用人工智能辅助主持人做好节目评论,可能会更实际些,国际上的主流电视台也已经开始了这方面的实践。
目前,业界对人工智能普遍持乐观态度。人们相信,就像互联网和移动互联网的诞生带来的现在的数字生活,人工智能也将为人类的生活带来巨大变革。正如在CES 2024上,英特尔CEO帕特·基辛格所说,我们可以把AI塑造成不可思议的、向善的力量。在AI领域,我们应该推动让AI技术开放、易获取、可解释和负责任。2024年,期待电视台能够在台前幕后发掘更多人工智能的用武之地。