ChatGPT:终于像个“人工智能”了
2023-03-16庞钢明王聃锋
庞钢明 王聃锋
山姆·奥特曼(左二)正从日常职责中抽身出来专注于“OpenAl”的研发,这是一家他与特斯拉创始人埃隆·马斯克(左一)共同创办的非营利性人工智能研究组织。
截止到2023年1月,ChatGPT月活跃用户数量迅速飙升至1亿,平均每天约有1300万用户访问ChatGPT网站。目前用户数量仍在持续增长,ChatGPT成为互联网历史上用户数量增长最快的应用。“OpenAI公司”总部位于旧金山,最早由特斯拉的马斯克等投资者在2015年共同创立,公司建立的目标是“开发造福全人类的人工智能工具”,目前由微软持股。
ChatGPT脱胎于2018首次發布的生成式预训练转换模型(即Generative Pre-training Transformer项目,缩写为GPT)。先后经历过GPT-2(2019年),GPT-3(2020年)多次的技术迭代,而GPT-4预计将于2023年年底发布,现有的ChatGPT则是基于现阶段最新版本的GPT-3.5研发的。
手机版“Chat Bot”正在与使用者聊天。
目前“OpenAI公司”并未公开ChatGPT的技术细节。但从过往公开发表的文献推测,其主要使用了“强化学习”的AI技术:首先搜集、整理、构建超大规模的样本数据集,包含公开网页、书籍、报纸等文本资料。工程师用样本数据来“喂养”一个处在“婴儿期”的AI模型,得到预训练的AI模型,类似于“孩童期”。工程师随后对它进行强化训练——由人类亲自对它生成的答案进行打分,打分高则“奖励”它,打分低则“惩罚”它。通过不断的训练学习,它的表现越来越接近人类。值得一提的是,这个打分的过程需要耗费大量的人力,为此OpenAI雇佣了大量的廉价肯尼亚工人,时薪低至2美元,这也遭到了众多媒体的抨击。
但不难看出,ChatGPT在底层技术原理上并没有根本性的突破,更多地体现在“超大规模取胜”上。这也意味着它需要超大规模的算力、人力、电力资源的支撑。早在2020年5月发布的GPT-3算法模型的参数量就达到了惊人的1750亿条,训练迭代一次的资金成本高达1000万美元。相比之下,谷歌开发的围棋对弈算法“AlphaGO”从零“学会”下棋,就经历了成千上万次训练的迭代,但因为超大规模的ChatGPT“学习”的成本过于高昂,所以即便在训练时发现了它的某个错误,工程师也不会就这一个错误去重新训练它。从规模到做法以及迭代费用上,ChatGPT真的堪称“前无古人”。
ChatGPT几乎是一位全能的“助手”,使用它也非常简单,输入一个问题,它就能根据你的要求给出答案。用户既可以和它进行简单日常对话:你今天的心情如何?也可以常识问答:中秋节是哪一天?或者知识问答:牛顿第二定律涵义是什么?文本改写:给出一段徐志摩的诗歌,把它改写成“欢乐”风格的文体,等等。除此之外,它还能根据上下文意思,进行阅读理解、逻辑推理、纠错改正等。无论是工程、科学、商业、历史等专业领域的问题,还是体育、文学、文化、艺术等贴近日常生活的问题,ChatGPT都能给出非常准确和引人入胜的回答,而且生成的回答中语法和句法错误很少,书面结构逻辑清晰,甚至ChatGPT能够承认自己回答的错误,指出用户提问中的细微错误,对话能力超乎大众“心理预期”。具体而言它可以成为人类的写作、编程等工作的“全能”小助手。
2023年2月以色列总统艾萨克·赫尔佐格在一个网络安全会议上致辞时便使用了ChatGPT创作的部分演讲稿。他演讲稿中的一句“警言”——“让我们不要忘记,是我们的人性让我们真正与众不同。”正是源自他向ChatGPT提出问题的回答——“写一段关于人类在超人类科技世界中所扮演角色的励志名言”。
ChatGPT能够以B级成绩通过美国宾夕法尼亚大学沃顿商学院MBA的期末考试,以C+成绩通过明尼苏达大学四门课程的研究生考试,甚至通过了美国执业医师资格考试。根据沃顿商学院一项针对4497名学生的匿名调查,约有17%的学生承认他们使用了ChatGPT来辅助完成作业,5%的学生则承认他们直接使用了ChatGPT生成的回答。北密歇根大学的哲学教授安东尼,在为自己任教的一门世界宗教课程的学生论文评分时,发现里面得分最高的居然是由ChatGPT创作的。尽管少部分教授认为将ChatGPT融入到教学中能够相得益彰,但更多的老师认为这与“抄袭”无异。在老师们看来,学生无需思考便能得出研究结果,会扼杀学生的创造力、想象力等。许多美国中小学校与高校都禁止学生使用ChatGPT完成作业,一些学校甚至取消了课后作业,改为随堂测试、手写作业或者口试等方式。华盛顿大学等高校也开始着手修订关于学术诚信的新政策,将“使用生成式AI”定义为“剽窃”。
由哈佛医学院作为共同完成单位发表的一篇论文《ChatGPT在人工智能辅助医学教育上的应用潜力》,则首次将ChatGPT作为了共同署名的作者之一,并声明ChatGPT对该论文的写作做出了贡献。但ChatGPT“创作”生成的文章并非总是“尽如人意”,存在观点不可信、事实性错误、数据错误、数据来源不合规、版权纠纷等问题,甚至会“一本正经地胡说八道”。《自然》《科学》等顶级学术期刊认为AI无法对其生成的文章负责,要求作者不能使用AI生成论文,也不允许将ChatGPT列为署名作者。国际机器学习会议也要求论文中不能包含由类似ChatGPT工具生成的文字。国内《暨南学报(哲学社会科学版)》也声明隐瞒ChatGPT使用情况将被退稿或撤稿。
ChatGPT也可与用户结对编程,结对编程是指两个程序员在一个计算机上共同工作,一个人输入代码,而另一个人审查他输入的每一行代码,这是一种商业软件公司推崇的软件开发的高效方式。而ChatGPT既能扮演“驾驶员”角色,生成用户需求的代码,也能与用户互换角色,扮演“观察员”角色,审查用户提交的代码是否存在错误等。向ChatGPT输入“用Python语言(一种编程语言)生成俄罗斯方块游戏代码”,它便可使用Pyhton编程语言生成完整的俄罗斯方块游戏源代码。用户运行游戏代码后若出现错误,可将错误信息再次“反馈”给ChatGPT,ChatGPT会提示用户需修正哪些代码片段。但要知道的是,这里的错误既可能是因为用户软硬件型号差异从而出现错误,也可能是ChatGPT生成的代码本身就带有错误。
一些技术能力较低的黑客也正在利用该功能生成恶意代码等黑客软件。以色列的信息安全研究机构“Check Point”发布的研究報告表明,他们在暗网中发现了大量利用ChatGPT工具生成的黑客软件工具,“菜鸟黑客”在ChatGPT的帮助下也能轻易掌握原本技术门槛较高的网络攻击、网络窃密等黑客技术。但ChatGPT对于算法构架设计等技术难度较高的问题就表现得“力不从心”了,生成的代码也并不完美。总而言之,ChatGPT现阶段擅长针对计算机软件开发领域的基础问题,生成商用成熟的代码片段,能够在一定程度上帮助“新手”学习编程,取代一些低阶的软件开发工作。
AI作画系统为世界名画《戴珍珠耳环的少女》画出了人物手臂和房间的背景陈设。
2020年3月日本漫画周刊《Morning》上刊登了AI仿制的手冢治虫作品《Paidon》,这也是世界上第一部由AI参与制作的漫画。
2015 年, 谷歌开源了用来分类和整理图像的AI程序“ D e e p -Dream”。“DeepDream”的开源除了帮助我们深入了解深度学习的工作原理外,还能生成一些奇特、颇具艺术感的图像。
2021年二次元漫画风格迁移工具“AnimeGAN”发布了其二代版本,更新后支持了风景照片和风景视频的三种动漫化风格(分别是宫崎骏、新海诚和金敏),视觉效果更佳。
ChatGPT作为AI技术中自然语言处理方向发展比较成熟的项目,也可以和其他架构的人工智能系统相结合,在更多领域的应用场景中发挥作用。如“语音识别AI、聊天AI、模拟人声AI”和ChatGPT结合后,会达到意想不到的体验感受:当用户拨打电话,“语音识别AI”系统将通话语音识别成为文本,输入到ChatGPT平台中,将它生成的答案文本,通过“模拟人声AI”转换生成模拟真实人声的声音片段,这个过程完全依靠计算机软件代码自动完成,用户根本无法察觉他们正在与AI通话。
“OpenAI公司”此前发布了一个名叫“DALL·E2”的AI作画系统,这个系统可以根据文本内容生成图像,如果将这类AI作画系统与ChatGPT相结合, ChatGPT优异的上下文理解能力,有助于AI作画系统更好地理解用户意图,从而生成更符合用户心意的AI绘图作品。但这种耦合的方式引发了一些担忧。美国贝尔弗科学与研究中心声称ChatGPT会“劫持民主”:别有用心的人可以利用它对每天的新闻快讯、博客条目和社交媒体的帖子发表数百万次的评论,从而影响大众的判断和社会舆论,而且手段非常隐蔽。
使用人工智能制作视频动画, 可以有多种不同风格。
输入一张手绘简图(左),通过图像合成系统,可以生成一张虚拟的照片图像(右)。
同时,ChatGPT最值得关注的商业化路径便是将它嵌入到搜索引擎中去。2023年2月微软宣布将ChatGPT技术嵌入到自家搜索引擎“必应”中,并展示了嵌入ChatGPT的搜索引擎将如何运行:将传统搜索引擎的搜索结果与ChatGPT对搜索结果的注释并排显示,用户也可以与得到ChatGPT技术加持的“必应聊天机器人”对话。微软的“Edge浏览器”在嵌入ChatGPT之后,也增加了“聊天”与“转写”功能——用户可以将这两个功能设置在侧边栏中,“聊天功能”可以让用户提问关于正在查看的网页或文档的问题,而“转写功能”就是提供写作助手之类的功能。
搜索引擎在嵌入ChatGPT后能够提高用户获取有用信息的效率。当输入“发烧该吃什么药?”时,传统搜索引擎会给出大量网页链接,用户需逐个点击网页链接直至得到所需的有用信息。而在ChatGPT技术的加持下,用户则直接得到“一般需要阿匹斯林类药物,但需在医生的建议下服用药物。”这个有用信息。因为ChatGPT强大的上下文本理解能力,所以能够比传统搜索引擎更加有效地理解用户意图,辅助筛选搜索引擎给出的搜索结果,删减无效信息,提高信息匹配度,节约了用户的时间成本,从而提高了用户的使用体验。但是,有些证券市场分析师不看好这个商业化路径,证券公司摩根士丹利认为,要消费者改变搜索和浏览的习惯本身困难重重,而且商业利益模式的改变更加困难,例如广告费用。
综合而言,如此高度自动化的ChatGPT若能投入商用,势必会取代或者优化大量重复、机械的文字类工作。如语音/文字客服、大规模数据统计分析、消息类新闻写作等等,但ChatGPT并不能完全取代人类工作,而是在一定程度上提高人们的工作效率,减少人为差错,丰富学习手段等等。律师、医生、学生、科研人员等职业将会因此而受益,因此“OpenAI公司”将ChatGPT平台描述为一种旨在补充人类而不是取代人类的工具。
ChatGPT的火热是多方因素综合作用的结果。首先,ChatGPT的出色表现足够惊艳,这反映了“OpenAI公司”深厚的技术能力。但出色表现并不意味着ChatGPT必然爆火,前代“GPT-3”问世时也惊艳了众多工程技术人员,但“GPT-3”对普通用户并不友好,使用难度较高,必须具备一定技术基础的计算机工程师才能驾驭。相比之下,ChatGPT入门门槛低,无需具备较高的教育文化背景就能“傻瓜式”地与其对话,受众面较广是爆火的原因之一。同时“OpenAI公司”使用内容过滤器技术,有效规避了道德、宗教等敏感话题,普遍用户根本无法诱导它“作恶”,媒体公共舆论压力大幅度减少,保证了其能够持续运营、继续扩充用户。
其次,用户与ChatGPT进行对话,就是上文提及的“打分”过程。“OpenAI公司”需要通过大量用户的使用记录,构建更加接近大众认知的超大规模样本的数据集,用作下一步的算法模型训练,这也是“OpenAI公司”和微软公司不遗余力地推广ChatGPT的原因之一。
再者,“OpenAI公司”与资本市场需要相互成就。一方面ChatGPT如此超大规模的算法模型成本高昂,需要市场投入资金。而另一方面,投资市场需要新的商业项目作为资金的流动出口,以寻求新的经济增长点;最后,ChatGPT触发了人类价值的焦虑。近年来“AlphaGo”“GPT-3”“DALL-E2”等爆款AI频出,它们的问世都能引发一轮“打工人”的恐慌,不断冲击人们对以往AI的预期认知,引发了大众对自我价值认知和生产方式转变的广泛讨论。
《百骏图》
《汉宫春晓图》
《千里江山圖》局部。
中国画很难画,但通过AI的修复及重新绘制,能够生成可输出的高分辨率图像。这UVQ2VKXMhTW8lX7qy8m1ig==项技术可以用在老旧照片、艺术品修复及图像内容数字化等领域。
但ChatGPT离大规模商业应用仍然“为时尚早”。即使微软已将ChatGPT技术嵌入到自家商业应用必应搜索引擎中,但这种嵌入并不是完美的有机结合。用作ChatGPT训练的数据集仅更新到2021年,意味着它并不知道当下发生的时事,更无法对新闻做出评论,时效性较强的新闻写作无法胜任。例如它并不知道2022年美国中期选举的结果。
从技术原理的角度看,要解决ChatGPT“知识库”陈旧的问题,则必须从零开始训练“学习”,而无法单独增加某个领域的知识,面对更大规模的互联网信息,ChatGPT若要实时抓取互联网知识并实时训练更新迭代,无论是从技术难度还是资金规模都难以想象,这也注定它无法作为搜索引擎使用。更为重要的是ChatGPT的底层AI技术原理并无根本性的进步,曾经“智障”AI普遍存在的问题ChatGPT也同样存在。
例如算法“黑盒”问题。由于AI技术本身的复杂性以及媒体机构、技术公司的排他性商业政策,算法犹如一个未知的“黑盒”,用户并不清楚算法设计的目标和意图。设计开发者也会因为算法规则不断的改变叠加,而无法对算法的底层原理做出现有问题内容的解释;以及算法偏见问题。这是指AI对某些事物并不能做出客观评价,也是因为AI的底层算法造成的,如果用大量“战争无罪”的数据训练它,那么AI就会得出“战争无罪”的结论;还有懂“计算”不懂“算计”的问题,AI也不具备人类通常具备的逻辑引申等能力;鲁棒性问题,也就是算法运行是否绝对可靠等问题。因此,ChatGPT需要进行持续优化算法,降低规模,才能走向大规模商业化,真正“造福全人类”。
19世纪,英国取得工业革命的巨大成功,机器制造大量取代人工劳动,蒸汽机技术加持的纺织机生产效率惊人,大量纺织工人下岗,引发大众对机器的恐慌,大量英国纺织工人闯入纺织工厂破坏捣毁机器,最后英国政府不得不派出军队进行镇压,此为“卢德运动”。
毋庸置疑,以ChatGPT为代表的人工智能技术假以时日势必会取得巨大进步,和工业革命时期机器“消灭”众多体力劳动岗位一样,人工智能也势必会取代落后于时代的众多劳动方式甚至劳动岗位,很可能会让许多人失业。但我们也应该积极地看到,工业革命淘汰落后生产力的同时,也诞生了更多先进的技术岗位。
再回看工业革命的时代,因为空前解放的生产力,创造了巨大财富,人们也逐渐认识到破坏机器本身并不能阻止时代洪流滚滚向前。主动适应时代的人类,自身劳动技能和生产能力也同样得到了长足进步,思想精神文明也随之极大地丰富起来,经济发展迈入了持续至今的繁荣时期。为此,不断学习,才能真正告别ChatGPT带来的失业焦虑,告别“卢德运动”。
(责编:南名俊岳)