新工具、新入口、新范式:AGI又要颠覆出版业?
2023-05-20张竞艳
记者|张竞艳
“这次扑面而来的不再是一匹狼,而是一头狮子!”
AI“创作”的童书插图
“ChatGPT 引发的人工智能对人类的影响比想象要大得多。比尔·盖茨在《人工智能时代已经开启》一文中说:OpenAI 的GPT 人工智能模型堪比1980 年GUI(图形用户界面),其重要性不亚于互联网诞生。英伟达的老板黄仁勋认为,我们正处于人工智能的iPhone 时代,是信息时代最伟大时刻。《经济学人》杂志更是提到历史高度,认为是一种翻天覆地的创新,可类比蒸汽机、电力和计算机时代,是‘第四次工业革命’……”
杨文轩一口气罗列了一长串AI 对社会影响的言论。自称“半个互联网人”的他一直是新技术的热情拥抱者,不仅有理论分析,还在不断践行。他和他的技术团队,最近集成了一个AIGC 工具包,完成了一套童书的AI“创作”过程。在他看来,“AIGC 带来的影响是全方位的,既是工具赋能,也是入口之争,最终将是范式变革。对于现有内容和出版产业,不仅是快慢问题,而是生死之争”。关于AI 对出版业未来的影响,杨文轩近日接受了《出版人》专访。
实实在在的技术革命
《出版人》:为什么ChatGPT 会突然爆红全球?它和原来的人工智能相比有什么区别?
杨文轩:讨论这个问题前,有几个概念需要厘清,了解它们之间的逻辑层次关系。
一是AI,即人工智能,也称为“机器智能”。这个概念已泛化,直接从字面上理解就可以了。二是AGI,通用人工智能,也叫强人工智能。“通用”的AGI 形成系统、广泛认知能力,能像人一样思考、推理和规划。直白点说就是“打通了”。三是AIGC,人工智能生成内容,常规的解释是“基于预训练大模型、生成式对抗网络(GAN)等人工智能技术,通过释放泛化能力生成相关技术的内容”,AIGC 通常和UGC(用户生产内容)、OGC(职业生成内容)、PGC(专业机构生产内容)相对应,是新的内容生产方式。四是ChatGPT,是一款人工智能的应用,AIGC 领域“现象级”的产品,AGI 行业入门级产品。
为什么ChatGPT 突然爆火呢?可将“Chat”和“GPT”分解开来解释:Chat 是聊天,具有通用性和公众性,GPT 是一种语言大模型。Chat+GPT,底层技术与日常生活应用关联在一起,引发关注就可想而知了。此外,ChatGPT-4 也有其独特之处。一是“生成式”:传统AI多数是“分析式”和“判别式”的,从数据库调取,作机械性分析判断,譬如人脸识别。ChatGPT-4 具有自我学习能力,能生成全新的内容。从“判别”到“生成”,人工智能跨越了奇点。二是“多模态”:AI 生成文字、图片、翻译、音频技术早就有了,但ChatGPT-4 等应用能生成动画、3D 建模、元宇宙,写代码,还能相互转换——文本生成图片、图片转换成文本,实现跨模态迁移。三是“自然语言”:语言是人类进化的里程碑,AI 自然语言意味着新的交互革命。人用自然语言与机器对话,机器按人的要求来创作故事,绘画,制作游戏。四是“多轮交互”:ChatGPT-4 能记忆和理解上下文语义,进行多轮交互,类人化进行交流。
总之,ChatGPT-4 及相关AI 技术引发的热潮并非概念,也不是“风口”,而是实实在在的一场技术革命——未来所有领域都会被重写、改造或者颠覆。
《出版人》:AGI 的威力的确很强大,它对内容产业会产生怎样的影响呢?
杨文轩:将事物放在时空框架上思考,才能发现其底层逻辑。面对如此重大的“技术革命”,我们需要回到原点去思考:什么是知识?什么是教育?什么是图书?什么是出版?需要思考当下知识、教育、出版的形成条件和过程。
图书是一种知识产品,教育是知识服务,出版是知识集成的过程。我经常讲一个观点:教育自古就有,但现代教育(科层制教育),不过两三百年历史,是为了规模化“生产”标准化劳动力;图书历史悠久,但现代出版(以平装书革命为标志),也不过100 年,是为了批量化生产标准化知识,都是工业革命大机器生产的产物,都是百年事件,都有时代性。
超越图书的具体形态(纸本书或电子书),从内容生产角度去思考,视野会变得开阔。我认为AGI 对于内容产业产生的影响将发生在以下方面。
第一,创意和创作分离:PGC 或者UGC,创作主体依然是人,AI 出现了新的创作主体,人作为自然智能的独创性丧失了,内容创作出现了新的社会分工。第二,创作的主体泛化:自然语言让创作门槛大大降低。任何人、任何时候、任何地点都可创作。PGC 的内容创作成本高,UGC 内容品质无法保证;AIGC 则具有低成本、高效率、高品质优势。第三,内容生产和消费边界消失:人们提问和发布指令,消费知识过程也在创造内容。第四,内容充分供给:海啸级的内容涌现,人们获取信息和选择知识的难度也大大增加了。第五,多模态内容供给:文字、音频、视频、动画、游戏、元宇宙,内容的形态变得越来越丰富,模态之间相互替代。
AIGC 引导着一场人与内容关系的根本性变革,将重塑和颠覆内容生产方式和消费模式,首当其冲对于出版这种典型的内容产业会造成影响。
“它将吞噬一切!”
《出版人》:出版业经历多次“狼来了”,但目前依然在增长,你怎么看这个问题?
杨文轩:出版业发生过很多次变革,经历多次“狼来了”。
平装书革命,传统出版商抱怨放弃古典价值;连锁书店攻城略地,独立书店惊呼文化多样性丧失了;电商平台售书,传统书店抱怨价值链被摧毁;自媒体和UGC 崛起,社会声讨碎片化阅读导致人们丧失了思考能力;电子书来袭,纸本书出版商扛起保卫战大旗;直播和短视频爆火,专家学者指责娱乐化挤占了阅读时间……
一匹匹狼蜂拥而至,但是出版业依然活着,甚至还能持续增长!然而,人们通常高估了自己所处行业的影响力,出版人更是有这样的错觉。事实上,从经济增长的角度,出版业远远跑输经济增长大盘;从社会角度,人类近十几年获取信息和知识量暴增,图书带来的增长微乎其微。
出版业正面临平装书革命以来最大的挑战。短期是“新工具”对当下产业链的改造,中期是“新入口”引导的渠道之争,长期则是“新范式”带来的知识生产方式颠覆。互联网大佬惊呼,社会舆论喧嚣,出版业却风平浪静,气定神闲。也许我们经历过太多次“狼来了”,对变化变得麻木了!
但是,这次扑面而来的不再是一匹狼,而是一头狮子!它将吞噬一切!
以前“狼”不过是同一物种的代际更迭,是为了规模化生产(从精装到平装),产品形态(从纸本到数字)多样化,以及提升销售效率(从独立店到连锁店、从传统书店到网络书店),底层逻辑都是工业革命。
AGI 从根本上改变了知识服务(教育)和知识产品(出版)的底层逻辑,具有毁灭性和颠覆性。
当海量和优质内容井喷式涌现,高成本、低效率、低环保的纸书还有存在价值吗?
当人人都可轻松生成(集成)内容,作家、策划人、出版人的界限有那么清晰吗?
当动画、元宇宙沉浸式内容大批量产生,图书的文本表达、纸书的物理载体还有存留价值吗?
这些疑问都没有定论,会有很多反对的声音。面对出版业即将来临的变革,有人一如既往地强调要坚守。我想问一句,我们在坚守什么?如上所言,现代教育和现代出版都不过是“百年事件”,并没有我们想象那么久远,也没有我们高估的价值。对于出版业,我从来就不是一个坚守派!
《出版人》:您强调AGI 深刻的影响力,能介绍一下它将在哪些方面改变出版业吗?未来出版将是怎样的呢?
杨文轩:AGI 的影响是全方位的,是持续性的,既是工具赋能,也是入口之争,最终将是范式变革。
首先是工具赋能。AGI 能降本增效,对产业链的改造是全面的——内容创作端,从大纲撰写、内容生成、插图生成、文字翻译,都可以由ChatGPT 完成;出版环节,编辑校对、排版设计、封面设计也有很多工具;营销环节导读生成、短视频文案、短视频生成;销售环节的数字人直播……传统出版效率低、成本高,低折扣、低毛利,已到崩溃的边缘,利用AGI 工具,也许能缓口气。此外,AGI 的多模态和跨模态,赋能到数字出版,我们孜孜以求的所谓“融合出版”,也许能轻易实现了。
其次是入口之争。AGI 将打开图书销售的新入口,阅读服务入口、教育服务入口。从线下到线上,从当当到京东,从渠道电商到平台电商,从货架电商到兴趣电商,图书不断经历入口之争。AGI 可以整合这些渠道,也可能替代这些平台。
我一直在思考AGI 时代书业新入口是什么。360 的周鸿祎在公司内部信中提出这样一个问题:“今天我们开发的所有网站和App,我们写的软件如何全部GPT 化,会产生什么样的化学反应?”同样,今天我们所使用的各种与图书有关的应用,是否还会继续存在,取而代之的将是什么?AGI 发展趋势是替代App,还是作为App 的一个插件?转型时期将是怎样的形态?终极形态是怎样的呢?
从场景上看,AGI 对教育出版影响最大。我测试用ChatGPT 来组卷,功能强大得令人惊艳。它可以为现在的教辅公司生成内容,为传统产业链赋能,但是它也将侵蚀教辅公司的领地。早期互联网花费巨资开发很多组卷系统,也号称AI 智能,其实不过是“判别式”AI。“生成式”AI能快捷、低成本创建组卷,那么我们教辅企业将何去何从?
最后是范式变革。我一贯喜欢“宏大思维”。AGI 对于人类知识形态、获取方式、知识服务(教育)、知识产品(图书)将产生颠覆性影响。当一个无所不知的“知识导师”陪伴孩子成长,现代科层制教育的学段划分、标准化教材、固定的教育空间、固定的课堂时间、填鸭式教学、评价体系将会解构;当我们有一个无所不能的“阅读导师”,创造出更容易理解的知识场景,传统纸本书这种形态还有存在意义吗?
AGI 正在打开大门,创造了大量机会。大家关注ChatGPT 作为聊天机器人(Chat)的存在,而忽略了GPT作为语言大模型的意义。未来在产业层面、公司层面、个人层面都会有自己的GPT,将深刻影响和改变产业形态和个人生活消费方式。
比尔·盖茨有一句名言:人们总是高估了未来一两年的变化,而低估了未来十年的变革。
“创新更让我兴奋”
《出版人》:您目前在AGI 领域有何尝试?
杨文轩:从业20 多年,我一直在互联网和出版传媒时代潮流中,但不是弄潮儿。我是典型的文科思维,但早期互联网经历,让我意识到技术的重要性。我一直培养一个小小的技术团队,从App 到H5,从微信小程序到抖音小程序,做了很多出版和阅读应用,比如“21 天阅读打卡”小程序有几百万用户,绘本借阅管理系统正在服务上千个绘本馆,当然大多数项目也都无疾而终。
创新和坚守是两难的选择。优秀出版人专注于产业,坚守于本业。我不是“坚守”的人,创新更让我兴奋,有个性原因,也有时代洪流的裹挟。小浪潮都跟进了,AGI这样“第四次工业革命”自然也不能缺席。我们这代人真的很幸运,能亲历“互联网”和“人工智能”两次技术革命,不置身其中会遗憾的。今天,我又被这股巨浪“裹挟”了。
我们的技术团队很小,做不了大模型,但长期扎根出版业。大模型降低了技术门槛,未来更多的机会在应用层面。应用也需要做API 接口和本地部署,需要一定的技术能力,很适合我们这样有行业资源的小技术团队。
我们也刚刚开始尝试,边学习边摸索。先做了一个与出版相关的软件集成网站,申请了ChatGPT 的API 接口。同时也尝试用ChatGPT 生成(创作)故事、翻译、文稿的编校,生成导读和评测题目;用MJ 生成内文插画、封面插图,用AD 来制作电子海报,用有声书、电子书制作短视频,用虚拟的数字人来做直播,完成一本书的全流程,将各种AI 工具进行串联,测试其优势和劣势。基于现有的业务流程,看是否能用“新工具”降本增效。
我们已尝试用AGI 做了一套童书,看起来效果不错,但也有一些难点和断点。难点是MJ 生成一幅画很容易,质量也很高,但是保持场景和角色的一致性、连续性有难度,要么头发颜色变了,要么衣服款式变了,还需要后期人工处理。可能是现有技术还不够成熟,也可能是我们的指令控制不够熟练。技术进步日新月异,这些小技术问题都会迎刃而解。断点则是软件之间跳转,目前还没有完整的集成工具可以用在出版流程,一些环节甚至没有成熟的AI 工具,只能人工补位。和技术团队工作时,深感人机对话能力的重要性,如何准确、清晰、简洁表达自己的想法和需求,未来指令(prompt)能力将是一个核心技能。
曾经以为AI 会先淘汰制造业工人,突然发现竟是我们这些内容生产者。无论是降本增效,还是入口之中,意味着有人会失业,要转行。类似文案、插画、设计、排版、视频制作等工作,人工智能效率更高,成本更低。如何面对这个挑战呢?苹果公司CEO 蒂姆·库克说:“我并不担心机器像人一样思考,却担心人像机器一样思考。”对于出版同人,大家都需要学习,需要交流。■