人工智能绘画在古诗图像化中的应用探索
2024-07-04张丽莉于聂浩
张丽莉 于聂浩
[摘 要]随着AIGC的智能创作时代的来临,人工智能绘画技术以其独特的优势,将进一步激活古诗图像化的文化传承活力、拓展其呈现的广度。概述了人工智能绘画的发展与特点,并从外因与内因两个角度分析古诗图像化的必要性,详细阐述了古诗图像化的实现原理和技术挑战,特别是文本理解与语义建模、图像生成模型的应用以及风格迁移技术的运用。以《九歌·云中君》为例,具体展示了古诗图像化的实践过程,包括文本的准备与理解、创作构思以及借助Midjourney等工具实现视觉呈现。案例实践对古诗图像化具有普适性,彰显了人工智能绘画工具在古诗图像化中的潜力,同时揭示其局限性,从而启示创作者继续探索,实现人工智能技术与文化艺术领域的深度融合。
[关键词]人工智能绘画;诗歌;图像化;《九歌·云中君》
[中图分类号]J222 [文献标识码] A [文章编号] 2095-7556(2024)11-0030-04
本文文献著录格式:张丽莉,于聂浩.人工智能绘画在古诗图像化中的应用探索:以《九歌·云中君》为例[J].天工,2024(11):30-33.
基金项目:湖南省社会科学成果评审委员会课题“明清《楚辞》插图研究”(编号:XSP18YBZ144)。
随着人工智能技术的突飞猛进,人们对其在各领域的应用潜力进行了更加深入的挖掘。在这股潮流中,人工智能绘画作为一种别具一格的艺术形式,正逐渐汇聚众人的目光。它巧妙运用机器学习和深度学习等尖端技术,实现了从文本到视觉图像的转化,不仅展示了其独树一帜的创作风采,更具有不可小觑的艺术价值。在人工智能绘画的众多应用领域中,古诗图像化转化尤为引人瞩目,这一创新方向既富有挑战性又充满了无限可能,因此备受学者和艺术家的青睐。
本论文的核心目标是对人工智能在古诗图像化方面的应用进行详尽的探究与分析。我们将结合实际案例,深入探讨人工智能技术在古诗图像化过程中的具体实现路径。同时,我们以《九歌·云中君》为例,并依据案例的成效,展示古诗图像化的实践过程,全面剖析人工智能绘画在古诗图像化方面的优势、局限性及未来趋势,旨在为相关领域的研究和实践提供坚实的理论基石和明确的操作指南。通过本研究,我们期望能加深人们对人工智能在古诗图像化方面的理解,推动古典诗文的传承与创新,以及人工智能技术与文化艺术领域的深度融合。
一、人工智能绘画的概述
(一)人工智能绘画的发展
人工智能绘画(AI绘画)的发展历程与近年来人工智能技术的突飞猛进及广泛应用紧密相连。随着机器学习的深入,AI绘画开始兴起。这一阶段,研究者尝试基于智能算法的AI绘画技术,以模拟人类的视觉感知和决策过程。这种方法不再完全依赖人工编码的规则,而是通过机器学习算法让计算机自动学习和掌握绘画的特征和样式。直到深度学习模型的出现和发展,AI绘画才真正迎来了迅速生长期。许多研究者开始尝试利用卷积神经网络(CNN)和生成对抗网络(GAN)等深度学习技术,生成各种形式的视觉艺术作品,这使得 AI 绘画技术飞速发展起来。现在我们所提及的“人工智能绘画”概念也更多地指基于深度学习模型而自动作图的计算程序。借助深度学习技术能自动学习艺术风格和创作规律,并创新性地转移和重构图像,生成更加逼真和具有艺术性的作品,在这一阶段AI绘画作品在质量和风格上都取得了显著的突破,展现出了人工智能在艺术创作中的无限可能。进入21世纪,随着人工智能技术的持续进步,人工智能绘画在艺术领域的应用也迎来了新的发展阶段。艺术家和研究者开始尝试更加复杂和多样化的艺术创作手法,推动艺术与科技的深度融合和共同发展。值得一提的是,2021年,OpenAI 发布了图像生成系统DALL-E,后续推出了DALL-E 2和DALL-E 3,这些系统在图像生成方面展示了卓越的能力。此后,Stable Diffusion、Midjourey 等AI绘画工具也相继推出,它们在图像生成方面展现了更高的能力和效果。
(二)人工智能绘画的特点
1.创作过程自动化
人工智能绘画技术以其强大的分析和学习能力,能快速分析并理解艺术家的创作意图,快速生成各种类型的图像,节省了传统手绘创作所需的时间和成本。如,通过输入一些关键词或简单的草图,AI能迅速生成一幅完整的画面。这种自动化的创作过程为绘画创作提供了一个高效的起点,也提供了更多的创作选择和可能性。
2.风格模仿与迁移
人工智能绘画技术在图像创作中的另一个亮点就是其对艺术风格的模仿与融合能力。人工智能是通过大量的图像数据训练进行深度学习后,分析出绘画中的各种元素和风格,并生成比较逼真的图像,从而生成具有特定风格的艺术作品。无论是油画的柔和质感,还是水彩的渲染效果以及具有意蕴的中国水墨风等,AI都能够轻松驾驭,并在保持原始风格的同时提供更多的创意选择。此外,还可以将不同的风格融合在一起,创造出全新的艺术风格。
3.修改和调整的便利性
AI绘图工具还具备强大的图像处理能力,提供了方便的修改和调整功能,使创作者不再受限于纸张和绘画工具。创作者可以轻松地调整颜色、线条、形状等各个元素,以达到理想的艺术效果。此外,AI还具备强大的图像处理能力,能自动完成一些烦琐的后期工作,如色彩调整、细节增强等。这不仅减轻了艺术家的负担,还让他们有更多的时间和精力专注于创意的挖掘和艺术性的提升。
4.个性化与交互性增强
AI绘画工具还能实现与用户的实时互动,根据用户的反馈和调整意见,对图像作品进行实时修改和优化。针对消费者个性化需求,AI绘画技术能根据用户的喜好和需求,生成符合其个性化需求的绘画作品。这种个性化和交互性的增强,不仅提升了用户体验的满意度,还为创作带来了更多的可能性与创新空间。
二、古诗图像化的理论基础
(一)读图时代是古诗图像化的重要外因
1.读者阅读习惯的改变
在读图时代,人们越来越倾向于通过图像来快速获取信息。这种阅读习惯的改变促使古诗的图像化,以适应现代读者的需求。古诗图像化能让读者更直观地理解诗意。
2.信息传播方式的变革
随着网络技术的发展,信息传播方式发生了巨大变革。图像作为一种直观、生动的信息传播方式,在网络时代具有更大的优势。古诗图像化有助于其在网络上更广泛地传播,让更多人了解和欣赏古诗的美。
3.视觉文化的兴起
读图时代是视觉文化兴起的一个体现,人们越来越注重图像的审美价值和信息传递效率。古诗图像化符合这一趋势,通过图像来呈现古诗的意境和情感,使读者能更快速地沉浸在诗歌的世界中。
(二)图像式思维是古诗图像化的内在动因
图像式思维是人类认知与表达世界的关键方式之一。人们经常借助图像来阐释复杂信息,这一思维方式能有效地将抽象概念与情感转化为具体的视觉形象。鉴于此,我们可以合理推断,图像式思维在古诗图像化过程中扮演了重要的内因角色。它不仅深化了我们对古诗的理解与欣赏,更为古诗在现代社会的多元表达与传播提供了动力。在推动古诗的图像化表达上,图像式思维的作用不容忽视。
1.直观性思维的驱动力
图像式思维直观的特点,使人们能将抽象的文字信息迅速转化为具体的图像。在古诗图像化的进程中,这种直观性思维成为我们将诗句中的描述与意象转化为可视化场景的驱动力。通过这种方式,我们能更轻松地领悟诗歌所传达的情感与意境。因此,图像式思维的直观性是推动古诗图像化的核心内因之一。
2.意象创造的内在驱动力
古诗中蕴含着丰富的意象,这些意象是诗人运用语言创造的具有象征意义的形象。图像式思维在理解和创造这些意象方面发挥着重要作用,促使我们以图像的形式将其呈现出来。这种对美的追求和对诗意的深入理解,激发了我们将古诗中的意象转化为具体图像的内在需求。
3.情感共鸣的心理倾向
图像式思维使我们能更直接地感受和理解古诗中的情感。在阅读古诗时,图像式思维引导我们在脑海中构建相应的场景,进而与诗人产生情感共鸣。这种心理倾向促使我们将古诗图像化,以便更好地体验和表达诗中的情感。因此,情感共鸣的心理倾向是图像式思维成为古诗图像化内因的一个重要方面。
(三)人工智能绘画技术推动古诗图像化的创新发展
1.激活古诗图像化的文化传承活力
古诗是中华文化的重要组成部分,蕴含着深厚的历史底蕴和文化内涵。然而,随着时代的变迁,古诗的传播和理解受到了一定的限制。利用人工智能绘画技术进行古诗图像化,可以将这些珍贵的文化遗产以直观、生动的图像形式呈现出来,帮助现代人更好地理解和欣赏古诗的美。这不仅有助于传承和弘扬中华文化,还能激发人们对传统文化的兴趣和热爱。同时,人工智能绘画技术实现了高效的图像化生产,能显著提高古诗图像化的速度与规模,从而加速古诗的现代化传播。
2.拓展古诗图像化的创新空间
人工智能绘画技术不仅能高效地生产图像,还能通过算法激发创意,为古诗图像化带来无限的艺术创新空间。例如,通过风格迁移技术,我们可以将古诗的意境与多种艺术风格相结合,创造出既传统又现代的图像作品。通过算法和模型的运用,我们可以将古诗中的意境和情感以全新的视觉方式展现出来。人工智能因其深度学习的能力,能依据古诗,结合历史、地理、文化等多方面的数据,智能地重构和再现这些场景。这种创新性的图像化过程,不仅丰富了古诗的表现形式,还为艺术家提供了更多的创作灵感和可能性。
3.增强古诗图像化的个性化体验
人工智能绘画技术大幅提升了古诗图像化的个性化体验。该技术运用先进算法,精准捕捉用户审美偏好,生成符合个人品位的古诗图像。用户可自定义色彩、风格和构图,打造独一无二的图像,展现个性化艺术魅力。同时,该技术提供了交互式探索,让用户深入参与图像创作,实时反馈调整,满足个人的情感需求。这种个性化体验不仅提升了用户的参与感和满足感,还激发了其创造力与想象力。总之,人工智能绘画技术为古诗图像化注入了新活力,让每个人在古诗世界中有独特的视觉享受。
三、人工智能绘画在古诗图像化中的应用实践—以《九歌·云中君》为例
(一)古诗图像化的实现原理和技术挑战
1.文本理解与语义建模
实现古诗图像化的第一步是对古诗文进行文本理解和语义建模。这涉及对古诗文中词语、句子和段落的理解,提取其中的语义信息、情感内容和意境描述。而古诗往往采用含蓄的表达方式,充满隐喻、比喻和象征,需要对诗句进行深层次的语义分析和理解。但是古诗的语法结构和用词与现代汉语存在较大差异,如押韵、对仗等修辞,以及古文中常见的省略和倒装等,这些特点增加了计算机理解和建模的难度。
2.图像生成模型的应用
基于文本理解的结果,采用图像生成模型来生成与古诗文相符合的艺术图像。常用的生成模型包括生成对抗网络(GAN)、变分自动编码器(VAE)、扩散模型(Diffusion Models)、循环神经网络(RNNs)、自动回归模型等。但对于艺术创作者,他们更偏向于利用人工智能绘画工具进行创作,如Midjourney、stable Diffusion、DALL-E 3等。这些工具各有特点与使用门槛,但都能为古诗图像化提供有力的支持,我们也可以根据自己的需求选择合适的工具进行应用。
3.风格迁移技术的应用
简单来说,风格迁移技术就是通过计算机技术将一种艺术风格应用到另一幅图像上。其核心原理是通过深度学习,特别是卷积神经网络(CNN),提取图像中的风格特征、内容特征等信息,通过训练和优化,学习如何将一种风格应用到另一种图像内容上。在古诗图像化中,可以通过对大量诗意画作品及现有同一文学题材的图像作品的学习从而风格化迁移到新的作品上。利用这种技术,可以使生成的图像更加贴近古诗文的情感表达和艺术风格。但风格迁移过程中存在信息丢失和失真问题。
(二)《九歌·云中君》图像化的具体实践过程
1.准备与理解:《九歌·云中君》的文本理解
第一,主题内容与诗歌结构。《九歌·云中君》是战国时期楚国诗人屈原所作的一首诗,它是《九歌》中的第二首。一首祭祀云神的诗歌,表达了人们对云神的崇敬和思慕之情。全诗采用巫者与云神对唱的形式,生动地描绘了云神的形象和威严,以及人们对云神的崇拜。诗歌开头由祭祀的巫人唱出,描述了她为了迎接神灵的到来而进行虔诚准备,如沐浴更衣,表现了祭祀的庄严和神圣;接着,云中君(即云神)所唱的部分正面描绘了云神的形象,展现了其威仪和神采,突显了神灵的尊贵与威严;诗歌中还描绘了神灵接受祭享后的情景以及神灵离去时在天空俯瞰大地的所见,体现了云神的高贵和神秘。末尾部分则表达了巫人对云中君的依依不舍之情,体现了人们对云神的敬仰。
第二,诗歌中的意象特征。在《九歌·云中君》中,具有图像特征的意象词语相当丰富,为读者描写了一幅幅生动的画面。云中君这一词本身就具有浓厚的图像感,令人联想到居住在云雾缥缈之地的神灵。“兰汤”与“沐芳”勾勒出祭祀前的净身仪式,人们以兰花熬制的香汤净身,静待神灵降临。“华采衣”与“若英”则细腻描绘了云神身着五彩斑斓、宛如盛开的花朵般的华美服饰。“灵连蜷”生动地展现了灵巫蜷曲的身体,仿若云朵轻盈飘舞,呈现出强烈的动态美。“烂昭昭”则是对璀璨场面的形象描绘,犹如耀眼的光芒,给予人深刻的视觉震撼。而“龙驾”与“帝服”则共同构建了一幅云神驾龙车、身披威严帝袍的雄壮画卷。“猋远举”如同云神迅速离去,宛若空中迅速消散的云朵,形象生动。“览冀州”与“横四海”更是将云神高高在上的神态,以及俯瞰冀州乃至四海的壮阔视野展现得淋漓尽致。
2.创作与构思:借助Midjourney实现视觉呈现
第一,提示词中的视觉意象引导。在图像生成的过程中,笔者可以使用一些视觉意象的描述,引导Midjourney更准确地表达古诗文中所描绘的景象和情感。例如,人物形象描述中,描绘云中君高傲俊美的形象,飘然若仙的身姿在云雾中徜徉;意象描绘提示词中,描述了云中景色;情感表达提示词中,表达出凄美与追思之情。
第二,图像风格和参数设置。Midjourney的图像生成主要有以文生图、以图生图两种形式。以文生图就需要在提示词中涉及图像风格的词语,它决定着图像生成的风格。图像风格的关键词包括具体的艺术风格,如水墨风、水彩画等;材质关键词和特定艺术流派或艺术家风格。从构图形式、色彩选择方面进行具体的参数设置并修改优化图像生成的效果。并且,Midjourney中,可以选择使用不同模型的版本,这可能会影响图像的风格和质量。
第三,图像生成。基于对《九歌·云中君》文本、情感、意象三个方面的分析,在Midjourney界面中输入prompt 提示词将启动图像生成模型,生成与古诗内容相符合的艺术图像。这些图像可能包括云中君的形象、云雾缭绕的山间景色以及诗中所描述的情感氛围(见图1)。
第四,实时交互调整。通过Midjourney的用户界面进行实时交互,对图像的风格、色调和构图等参数的调整,使生成的图像更加符合创作需求。这种交互式的创作过程可以让创作者参与到图像生成的过程中,提供反馈和指导,以达到更理想的创作效果,并对生成结果的画面语义内容进行评估与进一步调整,以实现对《九歌·云中君》文本内容的图像化。
(三)《九歌·云中君》图像化实践的启示与展望
首先,《九歌·云中君》作为一个实证案例,其图像化经验在古诗图像化领域有较强的适用性。案例中采用的“语—图”对应法、意象再现法等图像化方法,不仅适用于《九歌·云中君》这一特定作品,同样为其他文学作品的图像化提供了有益的参考与借鉴,既丰富了人们的艺术体验,也拓展了文学作品图像化的传播边界。
其次,本实践不仅彰显了人工智能绘画在古诗图像化领域的巨大潜力,同时揭示了其面临的挑战与局限性。在《九歌·云中君》图像化实践过程中,人工智能绘画的独特优势得到了充分的印证。其自动化的生成能力、实时的交互调整与修改功能,以及风格化迁移所带来的视觉呈现效果,均体现了其在古诗图像化中的价值与潜力。然而,实践中也发现了这一技术目前的局限性。古诗往往采用深邃、含蓄的表达方式,其中充满隐喻、比喻和象征元素,这对计算机对语义理解和建模提出了挑战。在创作中,为了让计算机理解古诗的文本内容,我们需要借助具有意象引导的描述词来辅助计算机进行理解和转换。尽管如此,随着人工智能技术的不断进步,我们有理由相信,未来将能战胜这些挑战,更准确地捕捉古诗中的视觉意象和情感,实现古诗图像化的更高境界。借助人工智能绘画技术,古诗图像化将会为古诗注入前所未有的活力,让传统文化焕发出新的光彩。
四、结束语
人工智能绘画技术通过机器学习和深度学习等先进技术,实现了从文本到视觉图像的转化,为古诗图像化提供了全新路径。在古诗图像化的过程中,人工智能不仅能理解和建模古诗的语义信息,还能运用风格迁移技术,将古诗的意境与情感以艺术化的形式呈现出来。本文以《九歌·云中君》为例,运用人工智能绘画工具Midjourney进行了实践操作。实践结果表明,Midjourney能准确捕捉诗歌中的视觉意象,并据此生成与之相符合的图像,从而帮助读者更直观地理解和感受古诗的韵味。这一创新应用不仅激活了古诗文化,还增强了古诗图像化的个性化体验。未来,随着人工智能技术的不断进步,人工智能绘画在古诗图像化领域的应用将展现出更广阔的前景和可能性。此外,古诗图像化实践中的伦理与版权问题也应引起足够的重视。创作者在进行古诗图像化创作时,应遵循相关原则、遵守相关法律法规,确保作品的合法性和正当性。
参考文献:
[1]赵宪章.文学成像的起源与可能[J].文艺研究,2014(9):16.
[2]许渊冲.许渊冲译楚辞[M].北京:中译出版社,2021.
[3]陈明.文学与图像[M].上海:中西书局,2023.