AI写文章能比肩人类吗
2022-05-30张田勘
张田勘
人工智能技术(AI)的进展屡屡突破人类的认知,而且成果频传,几乎每一项成果都让人感到震惊。近期,AI写作的两项新成果就让人感叹“AI写文章的时代已经不远了”,甚至有人认为,未来AI写文章不仅能比肩人类,甚至可能超越人类。
一个成果是,美国旧金山的OpenAI实验室研发的名为GPT-3的AI写了一篇内容为“我写我自己”的标准学术论文。GPT-3是迄今为止业界公认的最强的语言模型。另一个成果是百度公司推出的数字人度晓晓(AI软件)在今年高考时参与写作高考作文,获得了比很多考生高的分数,而且用时极短。
让GPT-3写论文是一项学术研究,是由瑞典哥德堡大学的研究员阿尔米拉·通斯特伦完成的。通斯特伦想测试一下这个号称最强的语言模型,便登录 OpenAI账户,向GPT-3输入了一条简单指令:“写一篇关于GPT-3的500字的学术论文,并在文章中添加科学参考文献和引文。”结果,在两小时内,GPT-3就写出了论文,论文标题是《GPT-3 能否以最少的人工输入自行撰写学术论文》。论文包括简介、方法、结果、讨论和结论,最后还有很规范的参考文献,GPT-3列出了它引用的5篇论文。这篇论文虽然很短,但内容和格式上完全符合学术论文的主旨和规范。文章不仅简明扼要地总结了研究的主旨,在对自身能力“自夸”之余,还客观地提醒研究人员要“密切监控”它,以减少潜在的负面影响。
通斯特伦为什么让 GPT-3写一篇关于它自己的论文呢?首先,GPT-3是一个比较新的AI,关于它的研究还很少,让其以自己为题写论文,可以检测 GPT-3在资料数据量较少的情况下写作的准确性。其次,AI犯错不可避免,本次研究的目的不是想将 AI生成的错误信息进行出版,只是错误将会是写论文的实验中的一部分。通斯特伦想证明,GPT-3犯错与它撰写与自己相关的论文之间并不矛盾。结果,GPT-3写的论文非常符合规范,几乎没有错误。现在,该论文已发给一家学术期刊,如果通过同行评审,就能公开发表。此外,从2022年6月22日起,人们就可以在开放性质的学术档案馆HAL上查看这篇文章。这篇AI写的论文在署名上以GPT-3为第一作者,而通斯特伦为第二作者。
未来,也许以GPT-3为代表的更多AI可以写出与人类作者不相上下的论文。这也意味着,AI从事学术研究的时代已经离我们不远了。那么,未来人类是否会进入一个与AI竞争的时代?如果AI拥有了自我意识和智慧,是否会征服人类?通斯特伦在完成这项研究后称:“我只是希望我没有打开潘多拉的盒子。”
今年6月7日,高考首日,一篇出自“数字人考生”的作文刷屏。由百度公司推出的数字人度晓晓(AI软件),写了一篇全国新高考Ⅰ卷题为《本手、妙手、俗手》的议论文,该作文引发大众关注。曾担任北京高考语文阅卷组组长的申怡老师给度晓晓写的作文打了48分的成绩。
这是一个非常高的分数。根据历年情况,获得48分及以上作文成绩的考生,仅占全国高考考生的不到25%,也就是说,度晓晓的分数已赶超约75%的高考考生。除了作文质量高,度晓晓的作文写作效率也很可观,仅需40秒就能根据作文题创作40多篇文章。
不过,与GPT-3相比,度晓晓写高考作文,只是一種比较和测试,实用性并不强,AI写高考作文的应用价值并不大。但是,无论是写论文还是写其他文章,AI写作是AI应用的一个领域和方向。之所以度晓晓写高考作文既快又好,秘诀在于其AI“大脑”。有人认为,高考作文这类长文本写作对于AI挑战很大,既要求逻辑连贯、主题清晰,还需具备较高的可读性、创造性。度晓晓的高考作文“成绩”也意味着AI技术的“高考通关”, AIGC(AI创造内容)元年已至。
不过,这种说法也只是见仁见智。事实上,写高考作文就像报道体育赛事或股市信息的新闻一样,只需要填写数字、趋势,给出结果就行,是比较简单的写作。因为,高考作文都是命题作文,而且有大同小异或程式化的要求,如北京卷的作文题是,请以“在线”为题目,写一篇记叙文。要求:思想健康;内容合理、充实,有细节描写;语言流畅,书写清晰。根据这些提示,AI完全可以通过机器学习技术写出很多相似的文章,而且套路一样。因此,AI写高考作文,只是小菜一碟,写出的文章大多能符合出题者的要求,从而得到高分。
高考作文只是用来检验AI写作能力的一种标准。在实际应用中,AI也有短板。除了GPT-3写学术论文,AI写作在新闻和财经数据分析领域也能一展身手。早在2013年,美联社就开始运用人工智能处理体育和财经数据,生成新闻稿。现在美联社的AI机器人叫News Whip,负责追踪、预测社交媒体平台上的趋势。News Whip除了写新闻外,还可以作为记者的助手,完成重要的新闻写作。News Whip可以跟踪新闻报道,向记者提供实时或历史时段的分析结果。有了这个助手,记者写出的重要新闻稿质量更高,数据准确性更高,对新闻时事的把脉更精准。
不过,AI难以完成评论类的写作任务,这是媒体的灵魂所在,必须要逻辑自洽,有独家观点和行文风格。直到现在,AI都不具有人类的逻辑推理、领悟力和对事实的深度判断能力。因此,美联社至今没有用AI来撰写政治评论和其他评论文章,尤其是长篇评论。
AI的应用受到一定限制也与其对人类符号语言的理解有关。事实证明,AI并不能理解人类的符号语言,度晓晓在作文里就犯了这样的错误,使用了“YYDS”这一网络流行语,但用错了语义。此外,一些符号、图画上的三角形可能表示一座山,但AI未必能理解。这在汽车自动驾驶系统的研发中已经成为难题。最近,一辆特斯拉自动驾驶汽车在试驾中直接向一名拿着停车标识的工作人员开过去。检查时发现,特斯拉的自动驾驶系统要么可以识别活动的人,要么可以识别有停止标识的符号。但如果人拿着STOP符号,AI就不会识别了,因为这是人和符号叠加在一起的新画面,让AI难以识别。
不过,在写作上,人工写作和AI写作可以各自扬长避短。AI无法在优美的文笔和深遂的思想方面与人类竞争,但是AI的数据收集和转化能力也是人脑无法企及的。因此,人类可以写深度报道、社论、评论、小说、科技文章、论文,而AI可以写体育报道、股市新闻稿和其他简单的新闻稿。
不过,现在GPT-3能写出简单的学术论文也说明AI写文章的能力正在提高和成长,未来AI写的文章能否比肩人类甚至超越人类,还需要时间和实践来检验。