科技叙事的生成式变革:人类智能与人工智能的互构与平衡*
2024-05-29周慎房曼琳陈蔚浩
周 慎 房曼琳 陈蔚浩
摘 要:在科学传播领域,如何有效地将晦涩的科学概念转化为公众易于理解的形式,达成科学严谨性和艺术展现力的精妙平衡,始终是一个挑战。生成式AI技术的快速发展为科学与艺术的融合提供了新的可能,使这种平衡不再只是一种创意追求,而是转化为人类智能与人工智能双向互动的技术工程问题。本文以大科学装置科普为背景,详细阐述了前沿科技资源在科普化进程中如何运用生成式AI工具开展科学性保障和艺术性加工创作,使科学性与艺术性得以双重实现,并激发出更广泛、更深入的科学对话和理解。生成式科技叙事将在科学传播中扮演越来越多元及重要的角色,其未来将向交互沉浸化、专业垂类化、教育方法化的方向发展。
关键词:生成式科技叙事;科学传播;大科学装置;数字艺术;前沿科技资源科普化;AIGC
DOI: 10.3969/j.issn.2097-1869.2024.02.016 文献标识码:A
著录格式:周慎,房曼琳,陈蔚浩.科技叙事的生成式变革:人类智能与人工智能的互构与平衡[J].数字出版研究,2024,3(2):125-132.
当代的科学传播并非单纯的知识性传播活动,而是通过传播主体对科学内容传播的解读和延伸。这种传播活动建立在科学性的基础上,兼具一定的艺术与审美价值。要想在不失去科学精确性的同时吸引公众的注意力,就需要在科学性与艺术性之间找到一个精妙的平衡点。传统科学插画家和视觉艺术家需要深入理解科学概念,并运用其艺术才能创造出既准确又美观的作品。然而,随着生成式AI的崛起,人们有了一种全新的方式——即通过人工智能生成内容(Artificial Intelligence Generated Content,AIGC)来实现这一平衡。
在绘画领域,AIGC已在创意表现方面展现出巨大潜力。在科学传播应用中,AI不仅可以通过大数据和机器学习的算法来理解科学概念,还能够生成极具视觉吸引力的艺术作品。圣路易斯华盛顿大学神经科技中心主任曾利用生成式AI工具——Midjourney生成一组野生红松鼠的图像,将其置于森林、太空、巢穴等不同的情景中,对神经科学和生理学的重叠概念进行了探索。这些艺术作品不仅整合了科技与艺术的融合维度,也填补了现在新媒介艺术的空白,将传播主体的创造理念、文化内涵和精神诉求传递给受众[1]。
本文以大科学装置生成式艺术作品创作为例,探讨作为前沿科技资源的大科学装置如何在科普化进程中运用AIGC实现科学性与艺术性的平衡,激发出更广泛、更深入的公共对话和理解,为科学家、艺术家、科技传播者和广大公众提供一个关于生成式AI时代科学传播的新视角。
1 案例选取
大科学装置是指经过长期工程建造而形成的一套复杂的、巨型的科研装置,是基础研究、应用研究和科学发展中不可缺少的基础设施[2]。我国高度重视大科学装置的建设,将其视为提升我国基础研究和应用研究水平、促进相关领域国际科技合作的重要支撑。大科学装置是重要的前沿科技资源,其科普化成为当代科学传播的重要命题。当AIGC绘画应用于以大科学装置为主题的创作时,其能够将设备的复杂结构和运作原理以直观的方式呈现出来,同时还能够通过艺术的形式来表达这些科学工具背后的美学和哲学思考。
1.1 案例介绍
“大科学·大媒介·大艺术——大科学装置艺术文献展”为本文的数字艺术案例。该展由中国科学技术大学科技传播系主办,于2023年10月24日至30日在全球1024开发者节及首届中国(合肥)国际科学艺术节上首次展出,展示以大科学装置为主题的生成式文献作品,吸引超十万人次入场观看。参展作品主要采用Midjourney、Stable Diffusion(以下简称“SD”)等AI工具,在人机融合共创机制下进行艺术创作,用丰富、生动的具像化创意表达向大众传递大科学装置的相关科学信息、知识与文化。
1.2 分析对象
大科学装置艺术文献展包括图片、音视频、文本、口述文献等作品。本文选取其中的《太阳交响》(Solar Symphony)、《針灸脉冲》(Acupunctural Pulse)和《质子秘境》(Proton Secret)三幅作品为分析对象,揭示其创作过程中如何运用AIGC工具调和科学性与艺术性。
1.2.1 太阳交响
《太阳交响》是基于全超导托卡马克东方超环装置(Experimental Advanced Superconducting Tokamak,EAST)的生成式科学艺术作品(见图1)。EAST有中国“人造小太阳”之称,是用来模拟太阳核聚变反应的大科学装置,其主机部分高11米,直径8米,重400吨,由超高真空室、纵场线圈、极向场线圈、内外冷屏、外真空杜瓦、支撑系统这六大部件组成[3]。
1.2.2 针灸脉冲
《针灸脉冲》是基于高频主动式极光研究(High Frequency Active Auroral Research Program,HFAARP)装置的生成式科学艺术作品(见图2)。
HFAARP的核心是一个电离层研究仪器(Ionospheric Research Instrument,IRI),可用于临时激发电离层的有限区域,以观测激发区域内发生的物理过程。该装置由180个高频交叉偶极子天线组成分阶段阵列,占地33英亩(约13.35万平方米),最高可产生3.6兆瓦功率的发射能力,这使科学家能够以可控的方式更好地了解大气在太阳自然刺激下的变化[4]。
1.2.3 质子秘境
《质子秘境》是基于超级神冈探测器(Super-Kamiokande)的生成式科学艺术作品(见图3)。超级神冈探测器位于日本,是在一个深达1 000米的废弃砷矿中建造的大型中微子探测器,其目标是探测质子衰变及寻找来自太阳、地球大气等不同来源的中微子,并观测银河系内超新星爆发。该设施的主要部分是一个高41.4米、直径39.3米的不锈钢圆柱形的容器,容器内壁装有11 200个光电倍增管,用于探测中微子与水中的氢原子和氧原子相互作用的后续过程产生的切连科夫辐射[5]。
2 工具要素
在科学传播的科学性与艺术性平衡中,科学性要求内容准确無误,艺术性则要求表现形式具有较强吸引力并易于理解,因此,科学传播不仅是一个创意问题,还是一个技术问题。AIGC是继专业生成内容(Professional Generated Content,PGC)、创作者生成内容(User Generated Content,UGC),专业创作者生成内容(Professional User Generated Content,PUGC)之后,利用人工智能技术生成内容的新型生产方式[6]。以AI工具Midjourney为例,其基于一套深度学习算法,需要创作者能够清晰地表达想法、熟练地掌握工具操作。AI生成的图像往往带有不确定性和偶然性,需要创作者调整参数使图像达到理想效果。这些新的科普内容生产工具在实现科学性与艺术性平衡方面,至少有以下三个可调用的工具要素。
2.1 提示词
提示词,或称触发文本[7],是创作者用自然语言提供的一系列指令或描述信息,AI根据这些信息生成符合创作者需求的图片,其具体内容一般包括主体描述、环境场景、艺术风格、材料质感、色彩灯光、构图视角、细节精度等。在Midjourney的模型生成路径中,创作者一般只需输入几个提示词,通过对提示词的不断筛选和重新编辑,使生成的图片与文字的映射更加符合创作意象。一般来说,提示词的相关性越高,生成图片的效果就越好。
2.2 图像提示
图像提示指使用一个已有的图像作为生成过程的起点或参考。创作者上传一张图片,AI会基于该图片生成新的图像内容。这种方法还被称为“垫图”或“参考图”,它可以指导AI沿特定的视觉样式或内容方向进行创作。在利用提示词生成图像时,图像生成的内容具备随机性与不可控性,而若利用垫图功能,一方面,机器可以通过素材垫图的方式进行再学习,使机器在学习中更接近于人脑的想法和人类思维的表达;另一方面,垫图可以让AI更加了解创作者的绘画意图,从而生成人类想要的作品,保证创作过程的连续性。Midjourney的垫图方式主要有两种:一是通过上传图像后再添加提示词进行调整,二是通过“/blend”指令进行图像混合。
另外,创作者还可以通过图像提示来反推自然语言提示词。以Midjourney反推提示词为例,创作者输入命令“/describe”后上传需要反推提示词的图片,Midjourney会以此生成四组图片反推后的提示词。总体来看,以反推提示词再次生成的图片与提示图片具有更高的相似度,这为再创作提供了灵活性空间。
2.3 参数调节
在人工智能绘画语境中,参数是被输入到函数或程序中用以影响图像生成行为的变量。参数可以看作是调整代码执行或算法表现的“旋钮”,可以控制图像生成的过程和结果,参数调节是对生成过程进行微调的设置,例如更改图片的风格、明暗、分辨率等。例如,创作者可以调整创作的风格参数来使得生成的图像更接近某个特定艺术家的作品风格,调整细节参数来获得更精细或更抽象的图像,调整分辨率参数来设置输出图像的像素尺寸,调整创意参数来调节算法生成图像时的创新程度,包括随机性或多样性。以Midjourney为例,其包含众多生成图像参数,部分参数示例见表1。
AI绘画生成图片时会经过加噪和降噪过程。“噪”指噪声,是图像中的随机变异或杂散信息,帮助模型探索新的图像区域。初始图像可以是纯随机噪声,也可以是有类别标签等的条件初始化噪声,以此作为生成过程的起点。在迭代生成过程中,生成模型有时会“故意”加噪,这是一种前向过程,即在图像生成时加入噪声以保证后续的降噪步骤能够更有效地引导图像向创作者期望的方向发展。降噪则是一种反向过程,用于减少图像中的颗粒和变色,并能够最大限度避免图像质量下降。值得注意的是,在对图像进行降噪的过程中,保留原图像的部分元素及人眼的视觉细节同样重要。创作者可通过调整参数来改变降噪过程中的步数和学习率,从而影响最终图像的外观。由于降噪过程是迭代进行的,过多的迭代可能会导致图像过于平滑、缺乏细节,因此创作者在调整图像的光线、材质、视角的同时,也要注意减少图像原始特征的损失程度,提高信噪比。
3 创作过程
在科学传播领域,如何将晦涩的科学概念有效转化为易于公众理解的形式,始终是一个挑战。而借助生成式AI,科学的严谨性和艺术的展现力在人类智能与人工智能的双向互动下不仅可以共存,还可以相辅相成。
3.1 科学性保障
在大科学装置生成式科学艺术作品创作中,主要通过图像提示、提示反推、语汇选择及作品文字说明来保障科学性维度声张(见图4)。
3.1.1 图像提示
使用大科学装置的真实图像作为垫图可以为生成模型提供一个准确的视觉参考,有助于使生成图像在视觉上保持科学的准确性。这些真实图像捕捉了装置的精确结构和环境上下文,为生成过程提供了一个基础框架。选择合适的大科学装置真实图片是生成图像过程中的一个关键步骤,因为其直接影响生成图像的质量和科学准确性,需要创作者了解该大科学装置的功能、重要性等信息,从科学研究机构的数据库、科学出版物、官方网站等可靠来源获得图像,对收集到的图片进行分析整理,再根据图片的清晰度、代表性、角度和视角、照明和对比度、有无干扰信息、版权和使用许可等综合标准出发,最终确定最适合作为垫图的一张或多张真实图片进入迭代创作流程。在实际操作中,可能需要对真实图片进行一些预处理,如裁剪图片、调整色彩等,以进一步提高其作为垫图的有效性。
如在《太阳交响》作品创作中,创作者选取网络资料“休斯顿自然博物馆魏斯能源大厅”(Wiess Energy Hall,Houston Museum of Natural Science)的核聚变展示图作为垫图(见图5)。
3.1.2 提示反推
提示反推指通过分析已有的大科学装置真实图像,确定哪些特定的描述词汇或短语能够更好地复现图像中的科学内容。在此过程中,创作者提取出垫图中的关键元素,如关于装置外观、结构和环境的确切信息,帮助生成模型理解主题的物理特征和实际的科学背景,将这些元素提炼为文字描述并形成一系列精准的提示词,并进入语汇选择的综合考量阶段,这有助于确保后期生成的图像在视觉上与真实的装置相匹配,帮助观众更好地理解这些复杂设备的实际外观。
如在《质子秘境》作品创作中,创作者通过在Midjourney中输入“/describe”指令对垫图进行提示反推,获得四组提示词(见图6)。
3.1.3 语汇选择
提示词是实现科学性与艺术性平衡的核心要素,在提示词中加入科学性的词汇可以确保作品在表达艺术性的同时,传达装置的科学原理和作用。通过选择包含描述装置工作原理的科学性词汇,可以使生成的图像更有重点地展示科学概念。创作者通过对提示词的不断筛选和重新编辑,使图片和文字的映射更加符合与大科学装置相关的专业知识及专有名词的指向性,有助于增强作品在科学界的融合度和对公众的科学教育价值。
3.1.4 文字说明
每件生成式科学艺术作品都可以附加一段文字说明,这些说明为观众提供了理解作品中科学元素的必要背景信息。作品文字说明中可以包括对大科学装置的描述,强调其在科学和技术上的重要性,解释生成的艺术作品如何与实际的科学研究相联系,提供科学数据或研究成果参考,向公众传达科学知识,提升其对科学的兴趣和理解。
创作者需要根据最初想象调试出的图片效果来决策是否需要垫图,垫图决策的过程实际上也是创作者深入掌握科学知识的过程。科学性的声张必然要经过严谨的调查、思考、求证和调试过程。在对生成图像进行提示词描述和调整的过程中,创作者首先需要找到相关大科学装置的介绍、影像、论文、设计原理图为生成图像提供参考,同时需要不断熟悉相关科学知识、理论,以及大科学装置背后蕴藏的文化内涵、历史发展、社会环境。
3.2 艺术性加工
在大科学装置生成式科学艺术作品创作中,主要通过想象调试、提示工程、高清转码、展示加工及策展设计以使艺术性维度得到彰显。
3.2.1 想象调试
想象调试在本研究中主要为创作者将自己对某一大科学装置的理解与想象转化为具体的创作思路和文本提示词。该阶段的重点在于创作者对大科学装置的个人见解、情感反应和想象力的运用,需要创作者将科学理解与艺术想象相结合,撰写出引导AI创作的提示词,这些提示词需要精确且充满创造力,以引导大模型生成符合创作者心中的大科学装置科学艺术形象。想象调试是初始阶段,迭代生成效果与创作者意象的符合程度是进一步创作的基础,本研究的三幅作品早期调试阶段生成图片效果见图7。
3.2.2 提示工程
生成式科学艺术作品创作中的提示工程指精心設计提示词和调整参数引导生成模型创作出科学性与艺术性相平衡的图像。艺术加工下的提示工程要选取能够激发AI创造力和艺术性的语言表达,精细调整生成过程中的参数,如风格、色彩、细节、构图等,以产生符合艺术愿景的效果,通过不断试验和调整,优化提示词和参数设置,以达到预期的艺术效果。本研究的三幅作品提示过程见表2。
3.2.3 高清处理
高清处理指根据不同媒体和展示场合的需求提高图像的分辨率,使图像更加精细,以便在大型打印或高清屏幕上展示时保持图像质量。在实际创作中,创作者将Midjourney生成的选定图片在SD上进行高清处理,在SD图生图脚本中选择SD upscale放大脚本,低分辨率版本将会被切割为n×n块小图块并分别进行重绘,同时预留图像可能重叠的部分,在每个小图块完成重绘后重新进行拼接,以保证图片的连贯性。最终的图像大小在确定图块重叠像素和设置宽高的基础上调整,其中包括对重叠像素设定值的添加,同时还需调整图像的缩放倍数来确保高清处理后的精确尺寸。图像高清处理在分割重绘的过程中具有不可控性且操作较为繁琐。
3.2.4 展示加工
在作品展示前,还需要进一步人为加工以满足展示的具体需求。如根据展示空间和艺术效果的需要对图像调整构图、应用艺术滤镜或进行色彩校正,以增强作品的艺术表现力和观赏价值,或者为艺术作品赋予一个有意义的作品名称,以反映其艺术理念及科学概念,增加其故事性和可理解性。
3.2.5 策展设计
完成作品创作后,作品的策展设计仍不能忽视。好的策展设计可以提升作品展示的艺术性和观众参与度。策展设计应考虑展览序言、海报设计、空间布局、动线互动等。如在大科学装置艺术文献展中,创作者设计了“实景弹幕提示词”交互式展览机制,邀请观众在看展时将想到的任何语汇写在展品旁边。该设计增加了互动元素,调动观众参与,也使作品的再创作成为可能,这些都将进一步丰富科学传播的手段和深度。
作品艺术性的彰显是通过一系列综合的创作和展示技巧完成的。AI绘画虽然并没有太多专业性的理论,但生成的作品仍然能被观众欣赏到其美妙之处,引起情感共鸣[8]。如《太阳交响》的画面整体色彩明快活泼,利用旋转木马、电流等具体意象,将高温等离子等晦涩、抽象的科学概念趣味性地呈现在大众面前;如《针灸脉冲》中一根根充满力量感的“银针”冲向天空,具备了视觉冲击力与美感;如《质子秘境》中,人们在地下千米的一潭静水中探索微观的宇宙奥秘。可以说,创作者通过AIGC实现了对大科学装置的浪漫构想。
4 未来展望
生成式科学艺术作品的创作是一个多维度、多步骤的创作过程,是激发人与人工智能双向互动的融合共创。艺术从诞生时就是技艺不分、密切联系的,而AI技术的兴起进一步催生了后人类主义美学,这一新兴领域注重分析技术进步对人类关系的影响,并探讨在科技浪潮下人类艺术的深层价值。它不仅考察艺术的实践性和反思性,更为探索人与高新技术融合的后人类美学路径铺平了道路[9]。可以预见,随着创作流程的沉淀、人工智能算法的进步及更多的生成式创作实践,生成式科学艺术将能够提供更为精准的科学信息,展现出更加深邃与复杂的科学概念,同时也能创作出更为丰富多彩、更具感染力的艺术作品。
AIGC在科学传播领域中扮演的角色也将日益多元和重要,跨学科合作可能成为生成式科学艺术创作的常态。艺术家、科学家、工程师和人工智能专家将更紧密地合作,共同打造跨越学科边界的创新作品,以全新的视角揭示科学与艺术的内在联系。生成式科学艺术作品的未来也充满无限可能性,如作品创作将更加注重观众的互动体验,增强科学传播的沉浸感;通过专业垂直的小模型精调,更好地理解细分科学知识,并生成更科学严谨的内容;将生成式科学艺术作为科学教育教学法,通过将学生作品创作与教学目的相结合,提高学生学习科学的兴趣和效率,让学习变得更加生动有趣。同时,如何在尊重知识产权、个人隐私和社会道德的前提下创造出既符合科学真实性又具有艺术价值的生成式作品,有待持续研究与实践。
生成式科學艺术的发展将不断突破现有界限,为科学传播带来新的革命性变革,其在启迪人们探索科学奥秘的同时,也为人类文化的多样性与创新性做出不可磨灭的贡献。科学与艺术可以成为数字艺术蓬勃发展的“双翼”,为其提供无穷的发展空间,增添更加多样的美丽色彩,推动人类文明不断演进。
作者简介
周慎,男,博士,中国科学技术大学人文与社会科学学院科技传播系、中国科学院科学传播研究中心特任副研究员。研究方向:网络与新媒体、科技传播。
房曼琳,女,中国科学技术大学人文与社会科学学院硕士研究生。研究方向:科技传播。
陈蔚浩,男,中国科学技术大学人文与社会科学学院硕士研究生。研究方向:网络与新媒体。
参考文献
[1]GAIDICA M. Science communication using AI generated images[EB/OL].(2023-01-31)[2023-12-28].https://gaidi.ca/weblog/science-communication-using-ai-generated-images.
[2]陈夕朦,郑念.浅析大科学装置科普功能的实现[J].科普研究,2015,10(5):17-24.
[3]中国科学院合肥物质科学研究院.大科学工程EAST[EB/OL].[2023-12-29]. http://www.ipp.cas.cn/dakexuegongcheng/east.
[4]University of Alaska.HAARP[EB/OL].[2023-12-30]. https://haarp.gi.alaska.edu/faq.
[5]Super-Kamiokande.Overview[EB/OL].[2023-12-30]. https://www-sk.icrr.u-tokyo.ac.jp/en/sk/about/outline.
[6]谷彤彤,田飞.融合数字出版背景下AIGC的发展与应用研究[J].新闻研究导刊,2023,14(7):4-6.
[7]周慎.新文本间性:生成式人工智能的文本内涵、结构与表征[J].新闻记者,2023(6):39-45.
[8]黄莞馨.AI绘画技术及其创造力和艺术性思考[J].玩具世界,2023(3):135-137.
[9]段吉方,阎恺祺.AI生成艺术与后人类技术的美学意义[J].厦门大学学报(哲学社会科学版),2023,73(6):54-64.
Generative Change in Science and Technology Narratives: Interconstructing and Balancing Human Intelligence and Artificial Intelligence
ZHOU Shen1, 2, 3, FANG Manlin1, CHEN Weihao1
1. School of Humanities and Social Sciences, University of Science and Technology of China, 230026, Hefei, China; 2. Science Communication Research Center, Chinese Academy of Sciences, 230026, Hefei, China; 3. Anhui Key Laboratory of Science Education and Communication, 230026, Hefei, China
Abstract: In the field of science communication, it is always a challenge to effectively transform obscure scientific concepts into forms that are easily understood by the public, and to achieve a delicate balance between scientific preciseness and artistic expression. The rapid progress of generative AI technology provides new possibilities for the integration of science and art, making the balance no longer just a creative pursuit, but a technical engineering problem of two-way interaction between human intelligence and artificial intelligence. Taking the popularization of large-scale facilities as a background, this study detailed how generative AI tools could be used to carry out scientific assurance and artistic processing in the process of popularization of cutting-edge scientific and technological resources, realizing both scientificity and artistry, and stimulating broader and deeper scientific dialogue and understanding. Generative science and technology narratives will play an increasingly diverse and important role in science communication, and will develop in the direction of interactive immersion, professional classification, and educational methodology in the future.
Keywords: Generative science and technology narratives; Science communication; Large-scale facilities; Digital art; Popularization of cutting-edge science and technology resources; AIGC