基于AIGC辅助铁路应用软件海报设计研究
2025-03-10张鹤王喆郭歌刘承亮朱韦桥
摘" 要:随着数字铁路规划的提出,对铁路应用软件的建设速度与质量要求越来越高。铁路应用软件研发面临的很重要的问题是队伍水平参差不齐、缺少专业设计人员,产出的软件产品的用户界面设计和用户体验质量差强人意。该文提出一种借助stable diffusion工具的AIGC能力,按照设计—生成—再优化的步骤,通过正向和反向提示词、调优参数以及蒙版重绘的手段实现较为高效的产出海报设计,既降低对设计人员的专业要求又节省整体出图时间。该方法应用在某业务安全日以及中秋节软件中海报宣传中,取得很好的效果。
关键词:AIGC;文生图;提示词;软件界面设计;海报设计
中图分类号:TP311" " " 文献标志码:A" " " " " 文章编号:2095-2945(2025)06-0133-05
Abstract: With the proposal of digital railway planning, the requirements for the construction speed and quality of railway application software are becoming increasingly high. The very important problems faced by railway application software research and development are the uneven team level, the lack of professional designers, and the unsatisfactory user interface design and user experience quality of the produced software products. This paper proposes an AIGC capability using the stable diffusion tool to achieve more efficient output poster design through forward and reverse prompts, tuning parameters, and mask redrawing in accordance with the steps of design-generation -reoptimization. It not only reduces the professional requirements for designers but also saves overall drawing time. This method was applied to poster promotion in a business safety day and Mid-Autumn Festival software, which achieved good results.
Keywords: AIGC; Wenshengtu; prompt word; software interface design; poster design
《数字铁路规划》作为中国铁路发展的重大战略,于2023年下半年正式发布。根据规划指示:“未来要建设高质量的数字铁路应用支撑数字化转型”,因此数字化应用的建设是未来数字化铁路建设的重要支撑。铁路信息化经过了40多年的发展已经颇具规模,取得了相当的成绩。但总体而言,铁路信息化水平尤其是软件研发能力更多地关注“实现功能”的层面,离数字化应用所需要的UI和UX高质量设计尚有不小的距离。
1" 问题的提出
目前铁路正在运行的信息系统超过2 000个,但大多数是企业内部应用,只注重功能而不注重用户体验,信息展示的合理性不足。造成这种情况的重要原因是铁路软件研发团队中产品设计岗人员欠缺,无法支撑“以用户为中心”的研发要求。
传统UI设计师主要的工作职责涉及视觉设计、用户界面设计和制定设计规范三大部分[1],其中视觉设计在视觉设计对于页面的美观度、情感化的提升是非常显著和重要的,是最能体现设计师创意和专业能力的。软件设计阶段的视觉设计的工作量是非常大的,一部分原因是营销运营的活动场景通常需要图片配合文案经常变动,且时间节点要求比较严格;另外是由于单场活动的出图量大。比如为了配合某一主题的营销活动,除了主视觉的设计需要设计人员的创意能力之外,根据线上终端和展示位的差异,线下物料打印尺寸等不同,还要花费大量的时间把设计好的主视觉做设计图的微调和适配工作。
进入2023年以来,以ChatGPT为代表的生成式人工智能(Artificial Intelligence Generated Content,AIGC)和大模型能力迅速发展,取得了一系列研究成果。文献[2]探讨了AIGC的发展历程,以及在设计行业的应用场景,包括广告设计、动画设计、游戏设计中的应用;文献[3]探讨了AIGC绘图工具在UI界面设计中的应用;文献[4]介绍了AIGC用于在服装设计图案的精细调色、色彩搭配的优化以及材料选择的创新等;文献[5]对stable diffusion和Midjourney 2个以绘画为核心主导的 AIGC 模型的动态图形设计进行介绍并给出了简要示例;文献[6]设计了基于AIGC常用模型的生成流程;文献[7]使用ChatGPT和Midjourney生成家居设计效果图,并指出了生成过程的不可预测性等问题;文献[8]使用Stable Diffusion生成虚拟人像,并对不同采样参数和采样方法的效果给出了说明与展示。
本文借助本地化模型Stable Diffusion能力,结合铁路应用软件设计风格,设计了一套适合铁路海报图的提示词,用于铁路元素海报的快速生成。
2" 基于AIGC的铁路软件UI设计方案
2.1" AIGC方案选择
AIGC与传统的任务导向型人工智能系统不同,生成式人工智能更加注重创造性和自主性[9]。AIGC通过算法和数据驱动,利用计算机视觉、机器学习和生成式对抗网络等领域的技术,实现对图形和内容的智能处理和生成。通过AIGC的规模化运用能以更快捷高效的方式完成以往比较复杂的创作过程,部分甚至完全取代已有的一些“人”的工作。
目前在AI绘图领域最知名的两大主流工具是Midjourney与Stable Diffusion。Midjourney是一款商业化产品,特点是上手难度较低、出图质量高,服务是端对端的形式,能够基于一个大模型快速响应各种风格或内容关键词的绘制,但受限于使用成本和无法私有化部署,不适合铁路应用软件设计。Stable Diffusion是开源基于扩散模型的文生图AI工具[10],可以生成高质量和高分辨率图像,但上手难度较大且对服务器配置要求较高。
Stable Diffusion webUI支持本地部署,支持的操作系统包括Windows、MacOS和Linux。在Windows上部署webUI需安装Python、CUDA和Git,以确保webUI的正常运行。本文使用的主机硬件配置见表1。
本文以软件中海报设计为案例,以“4.28世界安全生产与健康日”为主题,突出铁路职工时刻牢记安全为铁路生产与运营的第一要务,确保广大旅客生命财产安全。在构思方面,希望以手绘风格展示一位穿着安全制服的铁路职工在铁路站台做安全巡视,配图文字为“加强铁路运输安全,保障群众生命财产”。
2.2" 基本流程
在Stable Diffusion中有文生图和图生图2种绘图模式,基础的操作流程可分成4步,如图1所示。
最终的出图效果是由模型、提示词、参数设置三者共同决定的,缺一不可。其中,模型对画面的风格影响最大,提示词描述影响画面生成哪些内容,而参数则主要用于精细化控制画面的更多细节。图像生成后根据效果需要进一步优化和调整提示词以及调优参数。
SD的模型分为官方大模型和定制模型。官方模型虽然强大,但由于它的根本目的是通过预训练学习海量的图像数据从而提升模型整体的基础认知力,所以直接用官方大模型往往不能满足对细节和特定内容的专业绘图需求。它的真正价值在于降低了模型训练的门槛。相比之下针对特定方向训练的定制模型的理解和绘图能力更强,实际的出图效果反而有了极大的提升。工作中可以根据实际需要在开源社区中下载的定制模型安装使用或者根据需求训练铁路自己的模型使用。
提示词是用来调节绘图模型的一种方法,通过输入想要的内容和效果,让模型理解用户表达的含义,从而实现更准确的出图效果。Stable Diffusion提示词包括Prompt(正向提示词)和Negative prompt(反向提示词)。正向提示词用于描述想要生成的图像内容,而反向关键词用于控制不想出现在图像中的元素。提示词全部只支持用英文输入,只需要用词组描述中间用逗号隔开,顺序越靠前的词组权重越高。输入时没有严格的语法结构,不同模型对提示词的敏感度也不同,因此需要设计师不断探索,结合模型特点灵活书写提示词的内容。
2.3" 模型选择
首先根据想要的海报风格选择适合的定制模型,一般常见的定制模型可以分为2D风格、3D写实风格两大类。本文选择的定制模型为babes20Half.ewU1,与该模型相关的配置参数如下。Steps为25,Sampler为DPM++ 3M SDE Karras,CFG scale为7,Size为512×768。
2.4" 提示词设计
正向提示词根据所要表现的内容进行设计,可以套用公式:主体物+构成+环境色+质量+风格。经过多次验证,表2为满足需求的提示词组合。
2.5" 生成图像
基于设计好的提示词以及模型的默认参数,生成了若干张备选图,在其中选取构图、人物以及火车等主体最能表达原始需求需求的如图2所示。可以看到图2中虽然整体看起来还可以,但细节上有一些比较明显的错误:脸部和手的崩坏比较严重,铁轨的比例细节有一些错误。接下来需要进一步将利用Stable Diffusion 的局部重绘能力修复图片中有问题的细节。
2.6" 局部重绘与调优
2.6.1" 遮盖重绘
局部重绘可以最大限度保留图像中合理部分的前提下,对需要优化的区域进行重新绘制。因此,需要运用手涂蒙版将有待重新生成的区域遮盖起来,每次只遮盖一个区域。本图中需要修复的区域包括面部、手部、铁轨几处细节,采用分别遮盖并执行二次重绘。
2.6.2" 参数调优
配合蒙版的遮盖重绘,还需要调整模型的若干参数,使得重绘的效果更为理想。参数中对重绘影响比较大的几个参数包括:缩放模式、蒙版模式、采样方法、采样迭代步数和重绘幅度等,其中将采样迭代步数降低调整为22,重绘幅度增加调整为0.72,如图3所示。
2.6.3" 反向提示词设计
经过初步验证,仅通过正向提示词信息的调整效果并不理想。最终采用了“蒙版+反向提示词”结合的方案:首先把透视比例错误的铁轨,以及不真实的人物脸部和手部使用蒙版涂抹遮盖;接下来在提示词中添加如下反向提示词,见表3。
经过上述配置以后,重新生成图像,效果如图4所示。
2.7" 海报制作
图4的效果已经非常接近预期了,没有明显的缺陷,可以作为成图并进一步加工。最终生成的海报成图如图5所示。按照上述选取模型—提示词设计—成图—优化—再成图的工作思路,可以很快地完成若干应用软件中若干海报的设计工作。
利用AIGC的能力辅助设计海报的案例实践,可以形成运营物料的一套通用解决方案。利用以上的思路和方法,可以尝试运用AIGC解决客、货运,国铁商城等业务在各大节假日、宣传日等常见场景线上线下的宣传物料的快速设计和出图。解决铁路软件研发团队缺少专业设计人员,以及设计能力不足的问题。图6为利用AIGC制作的中秋节运营海报,画面主体表现的是中秋节亲人搭乘火车赶回一家人团聚的欢乐氛围,文案为“月满中秋,中国铁路助力团圆”。
3" 结束语
尽管AIGC在设计领域尚处于早期阶段,但已经展现出对软件设计带来实质性提升和变革的潜力。通过利用人工智能工具,设计师们可以更快速地生成创意、优化设计,并在不断的实验中不断改进。随着算力不断提升,将能够以更快的速度生成大量的设计作品。同时,AIGC也有不足之处,其对于具象的需求表现得要好于对抽象需求表现,AIGC绘画无法稳定地绘制出抽象统一的相机图标,但可以快而稳定地绘制出一个精美写实的单反相机图片。而人的优势恰恰在于把复杂的设计需求抽象和解构,同时对于需求是否被满足有着审美和判断,两者协作各自发挥优势将是未来希望达到的设计模式。
参考文献:
[1] 李翰林,姜勇.计算机图像处理技术在UI设计中的应用[J].电子测试,2021(10):117-118.
[2] 徐畅,杜欣泽,于凯迪.AIGC在设计行业应用中的挑战与策略[J].人工智能,2023(4):51-60.
[3] 王蕾.AIGC绘图工具在UI界面设计中的应用探析[J].电脑知识与技术,2023,19(26):108-111.
[4] 刘晓宇.AIGC在时尚服装设计中的创作辅助研究[J].染整技术,2024,46(3):63-65.
[5] 张福也.AIGC技术在动态图形设计中的影响[J].丝网印刷,
2023(12):97-99.
[6] 孙瑒,陈品,王强.图标设计整合AIGC技术的可行性研究[J].包装世界,2023(9):49-51.
[7] 陈园,方庆宁,熊芷璇,等.ChatGPT和MJ在家居设计领域应用的机遇与挑战[J].家具与室内装饰,2023,30(12):51-55.
[8] 曾建勇,沈晓萍.基于Stable Diffusion的虚拟人形象预设计的应用与研究[J].现代信息科技,2024,8(3):169-175.
[9] 许雪晨,田侃,李文军.新一代人工智能技术(AIGC):发展演进、产业机遇及前景展望[J].产业经济评论,2023(4):5-22.
[10] 何结平.人工智能绘画生成工具Stable Diffusion视角下平面设计发展研究[J].科技经济市场,2023(11):45-47.
基金项目:中国国家铁路集团有限公司科技研究开发计划重大课题(K2023S008-A(JB))
第一作者简介:张鹤(1993-),女,助理研究员。研究方向为用户体验设计、智能化UI。
*通信作者:王喆(1981-),男,博士,副研究员。研究方向为DevSecOps、云原生技术。