AI联手能否通过北宋时的画院入学考试?
2023-07-06牙幼稚
最近美国OpenAI 公司研发的聊天机器人“ChatGPT”横空出世,国内的百度公司也紧接着推出了大语言模型“文心一言”,再结合此前美国的研究实验室推出的AI绘图模型“Midjourney”等各种人工智能工具,大家想过这对我们的未来生活会产生多大的影响吗?
今天我要让语言AI“ChatGPT”和绘图AI“Midjourney”一起来试试人工智能是否能通过宋徽宗主持的难度空前的北宋画院入学考试,看看人工智能的智慧是否比得上古代画家的巧思。
乱山藏古寺
好了,正式开考。第一个题是“乱山藏古寺”。
我问ChatGPT,你怎么来理解“乱山藏古寺”。略作思考之后,它回答到:“Ancient Temple Hidden in the Chaotic Mountains.”(古老的寺庙藏在混沌的群山中)。老实说,理解得还不错!那我们就把句子转给Midjourney,并加上Chinese Painting(国画)的限定,让它来画画看!
不到一分钟,Midjourney就交卷了——它画了在高耸的山峰之间,坐落着一座古代的中式建筑,(图1)但建筑并没有小心翼翼地藏起来。更奇怪的是,山峰给人一种抽象潦草的感觉。看来是ChatGPT给它的队友留了一个陷阱,它用Chaotic(混沌的、混乱的)这个词限制了Midjourney的发挥呀!
那古代的考生到底是怎么来画的呢?古籍记载,大部分同学画的都是群山之间露出了一个小小的塔尖或者屋脊上的小兽,比AI画得含蓄多了。但考官仍觉得这些古寺隐藏得并不到位。当时最优秀的同学并没有画出寺庙本身,而是画了一整幅的荒山图,众荒山之中伸出一面小小的旗幡,并不见一点寺庙建筑本身。这下是不是藏得更彻底啦!(图2)
看来这一题,AI们联手发挥得不尽如人意呀!
关于牙幼稚
牙幼稚是一个幼稚的书画热爱者,也是一个喜欢“整活”的创意人。想要知道牙幼稚长什么样,或想了解更多中国书画知识,可以在小红书和抖音搜索“牙幼稚”或在Bilibili搜索“牙幼稚naive”唷!我们约好啦~
野水无人渡,孤舟尽日横
第二題,同样,我们先问问ChatGPT对题意的理解。ChatGPT很快回复到:“No One Crosses the Wild Waters,the Lone Boat Drifts All Day”(没有人渡过荒凉的水面,孤零零的船整日飘荡着),意思理解得也不错,那就让AI来画画看。
Midjourney交卷速度依然很快。虽然我告诉它,你要画“No One”(没有人),但是AI给出的答案,画了一个人站在船上。(图3)巧合的是,北宋时的考官最喜欢的一幅作品,正是船上画了一个人。
据说当时从第二名以下,大部分人画的都是岸边系着一艘空空的船,或者船舷上停着水鸟,或者乌篷上歇着鸦雀,来表示水域的荒凉。只有第一名与众不同,他画了一只船,船尾处有一个船夫正在睡觉,手里横抱着一支笛子。他的画面中不是没有人,而是没有渡河的行人——船夫正闲着呢!(图4)
这一题,AI们是真的理解了出题者的意图吗?我并不清楚程序背后经过了怎样的运算,但它们总算是画出了跟当时的魁首相近的画意。你觉得这一题AI表现如何呢?
踏花归去马蹄香
很快就到压轴题了。这一题字面意思不难,ChatGPT很快给出了理解:“Returning from a Walk among Flowers, the Fragrance of Horse Hooves Lingers”(从花丛间散步归来,马蹄的香味依然萦绕)。我把这个理解给到了Midjourney,暗暗希望它会给出一个出人意料的答案。
随着画面逐渐清晰,我有一点意料之中的失望。Midjourney给出的画面是花丛中有一个姑娘骑着马在赏花。AI已经努力在表现“踏花归去”这个主题了,也想通过摇曳的花朵、美丽的女孩来表现“香”的感觉。(图5)而北宋考试的时候,大部分考生也做了相近的安排,画了人们骑在马背上看花赏景。踏花、归去、马蹄都好处理,但众人之中,只有一位考生画的“香”飘到了主考官的心中。
这位考生,在路上画了一匹马,有几只蝴蝶围绕着马蹄翩翩飞舞!用蝴蝶来暗示香气,真是妙呀!看来就是这几只蝴蝶,飞到了考官的心底。(图6)
考试虽然结束,但争议仍在。最近AI的迅猛发展让人不能否认人工智能比人的效率更高,甚至更准确。那么人类真的要被取代了吗?我想,人类跟人工智能的区别,恰恰就是那些不中规中矩,需要灵光一现的地方。就像北宋时的考生一样,学会用旗幡暗示寺庙,用有人解读无人,用蝴蝶表现香味。更会运用想象力,这就是人与机器人的区别,你觉得呢?