APP下载

红色叙事情境下生成式知识组织与服务的逻辑理路和实践进路

2023-12-29张亚影

档案管理 2023年6期
关键词:文化旅游人工智能

摘  要:本文利用人工智能技术和元数据标引与描述技术,结合自然语言处理技术,如本体技术、语义网络技术等,根据输入条件生成与文本或语言序列相匹配的新数据,以此构建一套完整的基于数字内容的“生成式”红色叙事文本系统模型并进行应用分析。

关键词:生成式;知识组织结构;人工智能;文化旅游;文化继承与传递;智能化服务

Abstract: This article utilizes artificial intelligence technology and metadata indexing and description technology, combined with natural language processing technologies such as ontology technology and semantic network technology, to generate new data that matches text or language sequences based on input conditions, in order to construct a complete "generative" red narrative text system model based on digital content and conduct application analysis.

Keywords: Red narrative; Knowledge organization; Artificial intelligence; Generative; Cultural tourism; Cultural inheritance and transmission; Intelligent Services

1 引言

習近平总书记在党的二十大报告中指出,红色档案是我们党宝贵的成长历程和奋斗历程的记录。随着《2004—2010年全国红色旅游发展规划纲要》和《第十二个五年规划纲要》等重要文件的发布,全国各地开始积极推进红色叙事活动。为了促进红色文化的持续传承和进一步发展,需要从多个维度切入,提升其整合性、重组性、吸收性、优化性、适应性和先进性。

“红色文化”代表了中国共产党领导下的中国人民在革命和建设过程中所创造的物质与精神的宝藏,涵盖了红色的资源、传统和基因等核心元素。当前,红色叙事学理论被引入到红色文化研究领域,研究主要聚焦于对红色叙事数据的深入分析和挖掘,忽视了“大数据”时代背景下数字媒体技术带来的革命性影响。生成式知识组织是在大数据背景下,信息创新和利用的一种研究方法。

目前,以“红色文化”为核心主题的研究可以归纳为三种类型。一是借助数字化等智能技术对红色文化资源的开发利用,包括数字人文角度切入研究、红色资源开发的根源思想、多元化开发信息资源、以数字化为研究手段开发还原历史场景的研究路径等。二是红色文化资源开发利用的模式、路径等方面研究,包括跨行业合作的可持续化利用、基于场域理论的开发新途径、区域特色开发路径选择。三是红色文化的价值研究,包括红色文化资源价值重构和红色文化当代传承的有效路径等。目前文献研究主要集中在红色文化价值的探索上,从这些研究中挖掘出的知识相对有限,因此对生成式红色文化的知识组织研究显得尤为重要。从信息加工理论角度出发,运用系统科学中的“涌现”思想构建了一种基于知识组织化过程的生成式信息组织模型。生成式知识组织在推进信息社会的进步和发展中扮演着至关重要的角色。

生成信息资源的过程依赖于不同个体和组织间的互动与合作,有助于加强社会联系和提升信息化水平。本文从信息论角度出发,结合科学计量学方法和技术经济学原理,对生成式特征知识的创新进行了系统分析。

2 关于生成式

生成式描述的是一种依赖于模型的技术,根据特定的条件或输入,产生与模型匹配的输出结果,是一种描述语言现象和概念结构之间关系的理论框架体系。在自然语言处理的领域里,生成式模型经常被用来产生文本、文章、对话等自然语言的序列。信息资源的生成模式是在数字化生产环境中构建的,它基于特定的协议和规则,允许用户深度参与到产品的生成过程中。就生成式模型来讲,存在两种类型的生成式知识,一种是由人类思维逻辑引导的生成式知识,另一种是机器适用的生成式知识。

人类的生成式和机器的生成式都是指一种自动生成文本或语言的方法,但两者之间存在一定的差异。人类的创造方式可以是基于一个特定的主题、情境或目标,通过联想、创新和表达等多种方式,利用人类的经验、知识和创造力来自动生成文本或语言。

机器的生成式则是利用人工智能技术从已有语料出发,对特定问题进行推理、建模及求解,最终形成相应答案的过程,主要包括对文本中词频分布特征、句法结构信息以及句法语义关系等进行学习。通常,机器的生成模式是基于一个事先经过训练的语言模型构建的,它通过输入一个特定长度的前缀文本,并利用这个前缀来预测下一个单词或短语的出现几率,从而产生新的文本或语言版本。具有生成特性的人工智能(Artificial Intelligence, AI)能够结合“大型模型和海量数据”并根据用户需求快速地发现问题并且自动地推荐合适的解决方案。海量的数据资料能够为AI带来更为全面的视野和更深刻的洞见,从而让AI在更多的应用场景中展示其潜在能力。

生成式机器在速度、效率、准确性和可控性方面具有明显优势,但同时也存在着单调、刻板和缺乏人性化等不足。因此,我们应综合考虑它们各自的优势,扬长避短地设计出适合自己的文本创作方式,从而实现作品意义上的最大化。在真实的应用场景中,我们可以根据具体的需求选择各种生成策略,并努力融合这两种方法,从而最大化地展现其创作潜力和价值。本文主要分析人机交互方式实现生成式知识的组织与服务,目的是提升生成式的创造性和表达力。在这两种能力的共同作用下,生成式知识组织表现出创造性和转化性特征。

(1)创造性。伴随着信息技术的持续进步,知识的产生途径和传播渠道也在经历着不断的变革。数字化技术能够把实体资源转换成数字格式,从而便于存储和传播。人工智能技术使智能信息处理成为可能,从而实现了从人到机器的跨越。通过互联网技术,知识的传递范围和速度得到了显著提升,而多媒体技术则能以更为生动形象的形式将这些知识展示给大众。因此,生成式知识成为一种新的知识形态。人类拥有独特的认知和创造力,如想象力、创新能力和情感体验。通过联想、创新和表达等方式,基于个体的生活经验、知识积累、审美观点和情感体验等多方面的因素,生成式知识具有创造性和表达性。因此,在创作过程中,用户需要借助多种媒体工具进行信息整合,并对不同媒介间存在差异的内容进行分析处理,从而获得有意义的信息内容。用户有能力基于主题、场景、目的或情感状况等多种因素,采用非线性和灵活的策略来组织和产生文本或语言的序列,从而创作出既独特又富有表达力的作品。

(2)转化性。信息资源是一个持续演变和进化的过程,它的形成是一个不断变化的动态过程,这要求我们持续地吸纳、整合、分析和应用新的信息资源,以适应不断变化的环境和需求。信息资源能够在各种不同的形态和层面上进行转换和流通。例如,数据可以经过深入的分析和挖掘转化为信息,信息可以通过归纳和推理转化为知识,而知识则可以通过实际操作和应用转化为智慧。

3 逻辑理路

在“互联网+智能终端”的时代背景下,面对海量的信息和资讯,为了更有效地进行知识管理,有必要对现有的信息和资讯进行整合,这促使了知识生成研究的出现。目前国内关于知识生成的研究成果較多,但尚未有专门针对智慧驱动型知识生成机制与应用模式等方面开展系统深入研究的成果问世。

多年的研究表明,知识生成主要可以分为两大类:一是智慧驱动知识生成,二是数据驱动知识生成。智慧驱动型知识生成方式是在人类智慧的引导下,知识得以生成和创新。知识的形成最初是由个体的认知和过去的经验驱动的,它具有很强的主观性,通常是基于个人的经验来决定和推进知识研究的进展。数据驱动型知识生成方式是一种基于大量数据进行知识生成的方法,包括数据获取、数据处理与应用三个阶段,从这些数据中挖掘出新的规律和知识,然后通过对这些数据进行归纳和总结,并利用知识图谱和主题词标引等手段来表达和分享,从而推动实际应用,实现将数据和信息转化为知识生成的目标。

随着深度学习、内容生成技术、虚拟现实以及增强现实技术的不断进步,基于这些技术,用户在信息应用方面的研究也得到了更高层次的提升。人工智能的飞速发展催生了生成式知识组织的兴起,这种知识组织是知识管理中的关键环节,其核心目标是对现有知识进行高效的整合和组织,以方便后续的检索、应用和深入分析。

生成式知识组织通过制定特定的规则,将知识按照特定的结构进行分类、存储和索引,从而产生新的产品、新的业态、新的模式,将人类利用信息挖掘知识推向人机协同生成知识的新高度。

在人工智能技术的推动下,生成式的知识结构在知识生成基础上得到了升级,并在一定程度上参与到了“知识创造”的过程中。通过从各种数据和信息中吸取核心元素,可以创造出创新的内容和产品。利用数据处理软件从各种数据库、网站、文档和其他信息领域获取文章、报告、新闻、网页等载体的相关数据,通过删除重复、不准确、不完整或无效的数据,确保数据的质量和可靠性,对数据进行结构化处理。

利用大数据分析技术提取各数据源中蕴含的有价值的知识并加以提炼和总结。利用云计算平台构建基于云计算技术的元数据管理服务模式。在这个基础上,制定母体数据的采集、标准化和融合流程,确保来自多个来源的样本母体数据与电子资源等母体数据的统一管理,并促进了不同数据类型之间的相互关联和耦合。利用数据挖掘技术从海量异构数据服务中提取有效数据,构建基于本体和语义分析的知识库,并根据用户需求提供定制化个性化服务,从而形成一个完整的“开放式”知识服务平台。

本文通过对比分析,认为基于本体的语义网技术在知识表示、共享及应用方面更适合于作为一种新的研究手段。它们之间的互鉴之处在于,它们都与知识的处理和管理有关。知识的获取与表示是实现知识重用的前提,而知识生成则是将信息资源转化为可利用成果的关键。然而,它们在焦点和实施方式上存在差异。知识的创造过程强调创新和新知识的形成,这要求我们采用分析、整合和推断等手段来形成新的见解或应对策略。因此,知识生成更侧重于创造新知识。生成式知识组织更倾向于重视知识的整合和组织,其核心方法包括制定规则、创建索引和分类,以增强知识的可访问性和可重复使用性。

知识生成包含概念结构、语义结构以及关系三个方面。在知识的创造过程中,可以参考生成式知识组织的分类和索引技巧,以更有效地组织和管理新产生的知识。在构建生成式的知识结构时,可以参考知识生成的思维方式和技巧,以更深入地理解和组织现有的知识体系。

4 实践进路

目前,对红色叙事的保护主要存在“记忆”缺失、“文本”缺漏、“载体”单一等问题。生成式知识组织通过数字化、复制和出版等多种方式保护和传承珍贵的红色资源,能够有效地解决红色叙事所遇到的困境。

以保护为核心的生成式知识组织研究的关键在于在实际操作中强调创新思维和创造性,从现实出发,建构基于“生成”理念下红色叙事的知识体系框架。红色叙事在知识生成上的多元性主要体现在它的内容、展现方式以及起源等多个层面。利用二维、三维扫描、数字摄影、三维建模和图像处理等多种技术手段,对红色叙事进行数字化处理,生成红色文化遗产的图形结构、纹理等多种数字信息,构建一个完整而丰富的“红色记忆”数据库体系。

4.1 实例分析。下面以1948年爆发的豫东战役作为具体案例,探讨利用生成式技术构建红色叙事的方法与流程。

首先,红色素材组织。在数据预处理层面对原始数据进行清洗、去重、标注等处理。联合档案馆、图书馆、文化馆等文化组织,从书籍、档案、文章、电影、纪录片等渠道汲取相关历史素材,通过查阅文献资料,到遗址所在地和博物馆调查,走访革命前辈后代等方式,全面掌握红色文化资源的情况,并进行数字化资料采集。数字化采集的资料按照主题内容、时间顺序或使用途径进行翔实记录、分类、组织和存储,以此搭建红色资源采集分类的数字化模型。

其次,数据生成处理。利用文本摘要工具,将长篇的红色故事或历史文献自动压缩为简洁的摘要,进行分词、去除停用词、标准化等操作,对数字化采集模型存储中的材料以关键词、短语、句子、文段为目标进行摘要处理,将收集到的素材转换为可供模型训练的格式。例如,根据豫东战役的时间、地点、角色和事件等信息建立数据库,作为模型训练的预处理数据。在模型训练阶段,设定特定的主题或关键字,确保生成的内容更加接近预期。在模型应用阶段,通过输入一段引导性的文字或者关键词,模型即可根据已有的训练数据生成新的内容。经过人工评估和筛选,开发基于生成式工具的交互式学习应用,去除不合适的部分,保留高质量的内容。根据评估结果对模型进行调整和优化,提升生成的质量。尽管语言模型能够产生极其逼真的文本,但生成的内容仍然需要经过人类的仔细审核和干预,以确保其准确性和适用性。

最后,构建知识图谱。利用生成式工具构建红色历史的知识图谱。结合语音合成和影像生成技术,构建基于红色历史的智能问答系统。对已训练的模型进行微调、调整参数、改进结构等,以提高模型的性能和泛化能力。

4.2 对生成式参数调教。结合具体业务需求和场景进行参数的选择、调整和优化。实践中不断调整学习率,批量大小、迭代次数等参数在生成式工具框架各个层次发挥作用。

在深度学习层中,实践数据用于提高模型的鲁棒性和泛化能力。例如,使用实践数据来约束模型生成的文本长度、内容的合理性等。同时,豫东战役红色数据还用于防止模型出现过拟合现象,提高模型的鲁棒性。在生成式模型层中,实践数据用于生成更加符合人类价值观的内容。例如,使用实践豫东战役红色数据来限制生成图像的颜色、形状等,或者限制生成文本的情感倾向、主题等,以保证生成的内容更加符合人类的审美和情感需求。同时,实践数据需要根据具体的应用场景进行合理的调整和平衡。

4.3 问题分析。首先是收集和处理数据面的挑战性强。在红色记忆知识库的建设与完善过程中,对数据的采集与加工遇到不小的困难。鉴于历史事件、重要人物和地理位置的数据来源既广泛又复杂,确保数据的精确性和可信度变得尤为困难。同时,数据处理的过程涉及大量的文本、图像等非结构化数据,处理难度较大。为了确保数据的准确性和可靠性,需要对数据的采集和处理进行更加标准化和规范化的处理。

其次是对技术能力要求高。生成式的知识组织和服务需要与人工智能技术相结合以实现自动化生成,这对技术水平提出更高的要求。人工智能算法和技术的发展涉及多个领域,如自然语言处理、机器学习、深度学习等,需要具备丰富的研究经验和技能。与此同时,还需持续关注技术的最新发展,不断地完善算法与模型,以增强内容生成的精确度和多样性。

最后是用户需求的变化大。在描述红色事件的情境中,多样化的需求成为一个显著的挑战。人们对知识的需求各不相同,有些人更倾向于关注历史事件的具体细节和背景,有些人则更看重人物的形象和思维方式,还有一些用户则更关心特定地点的历史和文化背景。这需要加强对需求的分析和研究,提供更加个性化和多样化的知识服务。同时,也需要通过反馈和调研等方式,了解用户需求的变化和趋势,及时调整服务策略。

运用生成式工具做好红色述事并创造新知需要多方面的努力和合作。通过发挥生成式工具的潜力,结合红色资源进行创意和内容生成,并注重用户体验和反馈,不断提升红色述事的品质和影响力。

*本文系2023年度河南省档案科技项目“开封市红色档案资源数据库建设研究”(项目编号:2023-R-063)的阶段成果。

参考文献:

[1]翟乐,李金格.数字人文视阈下红色信息资源的遴选、组织与开发策略研究[J].情报科学,2021,39(12):174-178+186.

[2]丁华东,付亚楠.寻根、培根、铸魂:论红色信息记忆资源开发的思维逻辑[J].信息管理,2023(04):31-35+39.

[3]赵红颖,张卫东.数字人文视角下的红色信息资源组织:数据化、情境化与故事化[J].信息与建设,2021(07):33-36.

[4]彭庆红,孙晓丹.红色信息资源数字化开发利用的路径与梯度[J].信息学通讯,2022(04):10-16.

[5]陈艳红,陈晶晶.数字人文视域下信息馆红色信息资源开发的时代价值与路径选择[J].信息学研究,2022(03):68-75.

[6]刘芮,卜昊昊.文旅融合视域下红色信息资源开发的场域分析和行动逻辑[J].信息学研究,2022(04):17-23.

[7]陈勇,高维浩.广西红色信息资源开发的现状分析及路径选择研究[J].信息管理,2023(03):121-122.

[8]周林兴,崔云萍.区域性红色档案资源的协同开发利用探析:以长三角区域为分析对象[J].档案学通訊,2021(05):4-13.

[9]李晓琴,银元,何成军.新时代红色文化资源的价值重构:驱动、内涵与科学问题[J].西南民族大学学报(人文社会科学版),2022,43(01):46-50.

[10]何洪兵.价值遮蔽与彰显:红色文化的当代传承[J].四川大学学报(哲学社会科学版),2023(04):161-168+199.

(作者单位:商丘职业技术学院 张亚影,硕士,馆员 来稿日期:2023-08-20)

猜你喜欢

文化旅游人工智能
我校新增“人工智能”本科专业
2019:人工智能
人工智能与就业
数读人工智能
文化旅游发展研究
历史文化旅游资源的深度开发战略
贵州省文化旅游创意发展态势评价
凤县文化旅游业发展研究
文化系统剥离与市场割裂对文化创意体验产品的影响研究
体验视角下文化旅游产品深度开发研究