人工智能生成内容存在问题及应对策略研究

2023-12-21严益强赵颖

广东通信技术 2023年10期

［严益强赵颖］

1 AIGC 简介

（1）AIGC 是一种基于深度学习技术的自然语言处理工具，可以实现文本分类、情感分析、机器翻译等功能。其架构包括数据采集、模型训练、模型评估和模型应用等4 个主模块及3 个辅助模块。在应用场景方面，主要应用于人机交互，如智能客服、机器翻译，舆情监测、广告推荐等。随着技术的不断成熟，应用领域日益扩大，被人们寄予厚望。霍金甚至曾发出警告：“AI 可能会成为人类最伟大、也是最后一项发明”。自上世纪60 年代提出AI概念以来，几经风雨，潮起潮落，终于在近年实现了突破性进展，在诸多领域取得实质性应用，主要得益于智能算法及硬件（GPU&CPU）性能的极大提高，使得 AIGC 低时延应用成为可能。

（2）人工智能（AI）和AIGC 的主要区别：在于它们的用途和实现方式。AI 是指利用机器学习、深度学习等技术，让计算机模拟人类的智能行为，实现自动化、智能化的任务处理。AI 可以应用于各个领域，包括自动驾驶、智能客服、医疗诊断、智能安防等。

2015年，中国科学院大连物理化学研究所的刘生忠课题组采用升温结晶法生长出尺寸为 71 mm×54 mm×39 mm的CH3NH3PbI3单晶体[53], 其光学结晶质量大大优异于薄膜材料(见图4)，是目前报道的最大钙钛矿单晶材料。随后，该课题组在升温结晶法的基础上采用空间限域的方法制备出CH3NH3PbI3单晶片[59]。该方法具有很大的优势，可以通过调整基板之间间隙的大小成功实现单晶厚度的控制从而生长出一系列不同厚度的CH3NH3PbI3单晶片，使得钙钛矿材料方便应用于各种光电器件。

而AIGC 则是利用AI 技术生成人类无法产生的内容，例如文章、视频、音频等。AIGC 的实现方式主要是通过自然语言处理、计算机视觉等技术，将大量的数据进行分析和训练，从而生成与输入内容相似或具有特定风格的新内容。

AIGC 与AI 的联系在于，它们都是利用相同的机器学习、深度学习等技术来实现智能化的任务处理和内容生成。但是，AIGC 更加注重生成人类无法产生的内容，而AI 则更加注重模拟人类的智能行为，实现更加智能化的任务处理。

AIGC 和AI 在其他方面的不同在于，AIGC 主要用于生成内容，而AI 则可以应用于更多的领域。另外，AIGC更加注重生成的内容与输入内容的相似性和风格的一致性，而AI 则更加注重任务的完成度和智能化程度。

AIGC 和AI 的关系是，AIGC 是AI 的一个应用领域，通过利用AI 技术实现内容生成。同时，AIGC 也可以促进AI 技术的发展和应用，推动智能化时代的到来。

2 AIGC 构成要件

AIGC 包括7 个主要模块[1]，分别是数据采集模块、特征提取模块、模型训练模块、模型评估模块、模型部署模块、模型监控和维护模块。

（1）数据采集模块：这个模块负责收集各种形式的数据，包括但不限于文本、图像、音频、视频等。在收集到数据后，该模块还会进行预处理和清洗工作，以保证数据的质量。

（2）特征提取模块：在这个模块中，从原始数据中提取出有用的特征，以便神经网络能够更好地进行学习和预测。这个过程对于提高模型的准确性和效率至关重要。

（1）自动写作，例如新闻报道、文章、诗歌、小说等。

3)新方案可采用凝结水或工业冷却水作为冷源，利用除尘器前或脱硫塔前的高温烟气作为热源。富余的高温烟气余热可以用于加热冷风或凝结水，饱和烟气余热可用于加热凝结水，增加排挤汽机抽汽所做的热功，提高机组效率，获得更好的节能效益。

（4）模型评估模块：在模型训练完成后，需要对它进行评估，以了解模型的性能如何。这个模块通常使用测试数据集来评估模型的准确性和稳定性。如果模型的性能不能满足要求，就需要重新调整参数和结构，进行新一轮的模型训练。

t分布随机近邻嵌入算法（t-Distributed Stochastic Neighbor Embedding，t-SNE）是 Laurens于2008年提出的基于SNE的改进降维算法[13]。t-SNE将位于N维空间中的高维数据向量X1，…，Xn映射到D维空间中的低维向量Y1，…，Yn。其中yi与xi一一对应，使得低维空间中数据的分布可以反映出高维空间中数据间的关系。t-SNE的基本原理是将高维和低维空间中数据点之间的欧氏距离分别转换为两个n×n的条件概率矩阵来表示数据点间的相似性，然后最小化两个概率矩阵间的差别。

（5）模型优化模块[2]：经过模型评估后，如果模型的性能良好，但仍有提升空间，就可以使用模型优化模块来进一步提高模型的性能。这个模块通常使用一些优化算法，如梯度下降、随机梯度下降等，来寻找最优的模型参数和结构。

（6）模型部署模块：模型训练和优化完成后，需要将其部署到实际的应用场景中。这个模块负责将训练好的模型进行打包，并进行部署和运行。在这个过程中，需要对模型进行一些转换和优化，以便在特定的硬件和软件环境中运行。

（7）模型监控和维护模块：一旦模型部署完成并投入使用，就需要对其进行监控和维护。这个模块负责监控模型的运行状态和性能，以及处理可能出现的问题。此外，如果模型在使用过程中出现性能下降或者过时的情况，也需要对模型进行及时的更新和优化。

总之，AIGC 是一个非常复杂和庞大的系统，涵盖了数据采集、特征提取、模型训练、评估、优化、部署和监控等多个环节。通过各模块的有机配合和不断优化，AIGC 可以实现高性能、高效率的数据处理和分析任务，为人工智能的应用和发展提供强有力的支持。一个成功的 AIGC 系统，离不开海量的可信数据源，离不开优异算法及高性能的硬件。以GPT-4 为例，在训练过程中，OpenAI 使用了约2.15e25 的FLOPS(浮点运算），使用了约25 000 个A100 GPU(7nm 高性能图形处理器）,训练了90 至100 天。

3 AIGC 应用

与常规人工智能(AI）应用不同的是，AIGC 由于加入了新的元素，如自然语言处理，使得 AIGC 的用途更为广阔，前景无量。相信不远的将来，大量需要人工的工作将由智能机器人代替。以下列举了 AIGC 已经具备的能力。

（3）模型训练模块：这个模块的核心任务是使用深度学习算法对神经网络进行训练，通过不断调整模型参数和结构，以提高其性能。这个过程需要大量的数据和计算资源，因此需要有强大的硬件计算资源支持。

（18）人机交互，例如智能音箱、智能家居等。

（3）语音识别和生成，例如智能客服、虚拟助手等。

（4）图像识别和处理，例如图像分类、物体检测、人脸识别等。

（5）推荐系统，例如新闻推荐、电商推荐等。

（6）金融风险管理，例如信用评估、风险评估等。

3.2.2 分时段收取停车费用。适当调节停车需求，根据停车时间的长短进行分时段、分地段收费，可以实行弹性收费制度，鼓励短时停车以提高停车位的周转率。在此基础上，也可以对有不同需求的群体进行不同的收费标准，对长时间占用车位的人适当提高收费标准，从而确保停车场的利用处于相对均衡的状态。

（7）医疗诊断，例如疾病预测、医学影像分析等。

（8）智能城市，例如交通管理、环境监测等。

（9）智能制造，例如质量控制、生产过程优化等。

（10）智能教育，例如自适应教育、学生评估等。

（11）智能物流，例如物流路线规划、智能仓储管理等。

（12）智能营销，例如广告投放、市场调研等。

（13）游戏开发，例如游戏角色设计、关卡设计等。

（14）艺术创作，例如音乐生成、绘画创作等。

（15）安全防护，例如网络攻击检测、恶意软件检测等。

（16）电子商务，例如商品推荐、价格预测等。

（8）法律责任和知识产权问题：人工智能生成的内容可能涉及侵权、抄袭和知识产权问题，难以确定责任。

（17）智慧金融，例如股票预测、风险评估等。

被动雷达系统中目标散射截面主要与卫星-目标-接收机的空间几何关系、飞行姿态的扰动以及目标自身的材料与形状有关，在不考虑材料的前提下，通过对比A320和F-15C两款飞机的RCS主要特性，发现虽然飞机外形相差较大，但双基地的特性基本类似，说明卫星-目标-接收机几何关系在双基地雷达RCS特性中占据较重要的地位。考虑到双基地雷达RCS数据量要比单基地雷达大很多，仿真耗时更长，因此对于只要把握双基地RCS基本特性的情况，可以参考文中的仿真结果。

（2）自动翻译，包括不同语言之间的翻译。

（19）数据挖掘和分析，例如商业决策支持、市场调研等。

（20）生命科学，例如药物发现、基因研究等。

（21）企业内部智能助手，为员工提供各种信息和帮助。

当无水蒸气加入时，约 80%生物质碳转化为CO，其余转化为 CO2和 CH4（<4%）。合成气 H2含量和H2/CO比较低，分别为39.4%和0.83。随着Steam/C比增大，在载氧体提供的晶格氧和水蒸气共同气化介质作用下，提高了合成气收率、合成气中H2和CO的收率。此外，水蒸气加入抑制载氧体被H2还原反应，避免H2消耗，因此CO和H2含量随水蒸气量的增加呈相反趋势，合成气 H2/CO比和CO2含量随Steam/C比增大而增大。

马克思人学存在论将人的存在问题作为核心，从人的生存、发展、归宿中，探索体育与人的关系，从而建立人存在的维度。从“感性的人”出场，“现实的人”为起点，关照“实践的人”，旨归“完整的人”，建立了体育与人之存在关系的多向维度。体育是人的感性活动，是人类在现实中对抗自然的最好方式。基本的身体实践活动构成了体育最初的结构范式，它让人类足以躲避野兽的穷追猛赶、改变恶劣的生存环境、解决自身的生存问题，从而得到自由的满足。体育让人顽强地行走在社会文明的演进中，让人得以立身于世界。体育作为人之主体存在，定然肩负着促进人的全面发展的重要使命，是人之为人的终极关怀，亦将成为人的发展存在的规则与定理。

（22）智能客服，自动回答用户的问题和解决投诉。

（23）智能医疗病历分析，利用自然语言处理技术自动分析病历。

（24）智能法律合同审核，自动分析合同并提示潜在风险。

（25）智能零售，根据用户购买行为推荐商品和促销策略。

（26）智能交通，包括交通流量预测、信号灯控制等。

（1）知识和信息的准确性不可靠：由于人工智能系统主要依赖于训练数据，其中可能含有错误、虚假或不完整的信息，导致生成的内容缺乏准确性。

（28）智能金融风险控制，利用人工智能技术预测和控制金融风险。

（29）智能人机交互，实现人与机器之间的自然交互和交流。

（30）智能图像搜索，通过图像识别技术快速搜索相似图片。

（31）智能会议助手，自动记录会议内容并生成会议纪要。

（32）智能家居，通过人工智能技术实现家居设备的智能化控制。

（33）智能教育管理，实现学生和教师之间的智能化管理和沟通。

（34）智能项目管理，通过人工智能技术辅助项目管理和管理决策。

（35）智能健康管理，通过人工智能技术实现健康状况的监测和管理。

（36）智能零售选品，根据市场需求和消费者行为推荐适合的商品。

（37）智能量化投资，通过人工智能技术实现投资策略的制定和优化。

（38）智能内容创作，通过人工智能技术自动生成文章、视频等。

（39）智能皮肤诊断，通过人工智能技术诊断皮肤疾病并提供治疗方案。

（40）智能保险理赔，通过人工智能技术快速审核和理赔保险案件。

4 AIGC 存在问题及应对举措

在 AIGC 大放异彩的同时，也要看到 AIGC 无论从技术层面，还是在应用层面，都存在隐忧。必须加以深入研究。否则，可能后患无穷。

AIGC 目前存在的问题如下。

（27）智能制造过程优化，利用机器学习技术优化制造过程。

应对措施：应建立更严格的数据筛选和校验机制，确保训练数据的可靠性和准确性，同时持续监测和更新模型以提高内容的准确性。

（2）语言与语境理解困难：人工智能系统在理解复杂的语言和语境方面仍存在挑战，容易产生歧义或错误的解读。

应对措施：加强自然语言处理(NLP）技术的研究和优化，提供更有效的语言和语境理解能力。

课程考核是课程教学模式的最后一环，也是保证学习效果、评价教学模式的总阀门。现行国际商法课程的主流评价方式仍是以终结性评价为主，过于重视理论知识的考核，忽视实际动手能力和综合素质的评价，不能满足应用型高技能人才培养的要求。国际商法课程应该依据职业标准中的项目权重，采用双证融通、多元评价的课程考核方案。

（3）难以产生创造性和原创性的内容：人工智能生成的内容常常缺乏独特性和创新性，容易陷入重复和模仿。

色谱柱为Waters Symmetry C18（4.6 mm×250 mm，5.0 μm）；荧光检测器激发波长327 nm，发射波长521 nm；柱温为30℃；流速为1.0 ml/min；进样量为20 μl；流动相为0.02%磷酸溶液（A）和乙腈（B），梯度洗脱程序见表1。

应对措施：建立法律框架和准则，明确人工智能生成内容的责任界定和知识产权归属。

应对措施：引入创造性算法和技术，激励系统生成更具创新性和原创性的内容。

（4）缺乏情感和情感理解：人工智能系统往往无法准确捕捉和理解情感和情绪，导致生成的内容缺乏情感共鸣。

应对措施：进一步研究情感理解技术，使人工智能系统能够更好地理解和表达情感。

（5）潜在的伦理和道德问题：人工智能生成内容可能被滥用或用于误导、欺骗或传播虚假信息。

应对措施：建立监管机制，确保人工智能生成的内容符合伦理和法律要求，同时提高公众对人工智能生成内容的辨别能力。

金沙江地处滇西北三江并流区，流域面积广，海拔高差显著，支流众多，气候湿热，降水充沛，植被覆盖率高。金沙江良好的气候条件及多样的植被类型造就了该区丰富的物种多样性。淡水真菌作为水体微生态系统的重要组成部分，目前尚未有金沙江淡水真菌方面的相关研究。本项目采集金沙江不同海拔、不同河段的腐木进行木生淡水真菌多样性研究，了解该地区淡水真菌资源、多样性特征及群落组成，为金沙江木生淡水真菌的保护与利用提供本底资料。

（6）安全和隐私风险：人工智能生成的内容可能被黑客攻击或滥用个人信息，造成安全和隐私问题。

应对措施：加强数据安全和隐私保护措施，采用加密技术和安全认证，并提升用户对自身信息的保护意识。

（7）文化差异和误解：人工智能系统难以充分考虑文化差异和背景，导致生成内容可能对其他文化群体产生误解或冲突。

应对措施：加强跨文化理解和多样性的研究，确保生成内容能够尊重和适应不同的文化习俗和价值观。

目前的九价疫苗已经可以预防9种HPV病毒引起的宫颈癌、尖锐湿疣、外阴癌和肛门癌，保护率达90%[8]。研究表明，HPV预防疫苗可以降低发病率，且无严重的不良反应，目前也没有用药后致死的案例[9]，证明疫苗具有安全和高效性。疫苗虽然对超过适宜年龄的女性也有一定益处，但作用效果远没有适宜年龄接种好，因此在适龄接种预防疫苗是当前最适合的宫颈癌预防方法[10]。

直译是指一种常用的翻译方法--既忠实于原文内容，又忠实于原文形式。在某种颜色在英语和汉语中的语用意义相同的情况下，我们可以采取直译法。

本研究的不足之处在于失血量的准确计算取决于入院时和术后最终血常规及术中失血量测量的准确性，测量过程中不同的测量者和测量机器可能存在测量误差。另外血容量计算公式中未纳入围手术期补液量，忽视了围手术期静脉滴注与静脉输液有关的影响。本研究对于其他影响术后隐性失血的因素未作分组，包括年龄、BMI、性别、内科基础病、患肢位置等，未能分析以上混杂因素对失血的影响。

（9）可解释性和透明度不足：人工智能系统生成的内容通常缺乏可解释性，难以理解其生成过程和决策依据。

应对措施：发展可解释性人工智能技术，提供对生成内容的解释和透明度，增强用户的信任和接受度。

（10）对人类创作的威胁：人工智能生成的内容可能影响到人类创作的市场和价值，导致自动化取代人类的创作过程。

应对措施：强调人类创作的独特性和价值，鼓励人与机器的合作创作模式，促进双方优势的互补。

（11）权威性和可信度困扰：人工智能生成的内容可能缺乏权威性和可信度，难以分辨真实信息和虚假信息。

应对措施：建立可信度评估机制，结合专家审核和大数据分析，提供可信度标识或信誉评级。

（12）缺乏语言风格和个性化：人工智能生成的内容可能缺乏个性化和特定的语言风格，难以满足用户个性化需求。

应对措施：进一步研究个性化生成算法，提供基于用户喜好和需求的个性化内容。

（13）深度理解和推理能力不足：人工智能系统在深度理解和推理方面存在局限，导致生成的内容可能缺乏逻辑和连贯性。

应对措施：加强自然语言推理和推理机制的研究，提高生成内容的逻辑性和连贯性。

（14）训练数据偏差和歧视：人工智能系统训练数据可能存在偏差，导致生成的内容不公平或存在歧视。

应对措施：实施多样性和公平性的数据采样策略，避免训练数据的偏差和歧视，提高生成内容的公正性。

（15）学习和迭代效率较低：人工智能生成内容的学习和迭代过程较为耗时，限制了其校正和改进的效率。

应对措施：采用增量学习和自动化迭代算法，减少学习和改进的时间成本，提高效率。

（16）内容过于机械和呆板：人工智能生成的内容常常缺乏人类的表达和情感色彩，显得机械和呆板。

应对措施：结合情感生成和语言变现技术，使生成内容更加生动、富有表达力和情感。

（17）难以处理复杂任务和领域专业性问题：人工智能系统在处理复杂任务和领域专业性问题时存在困难，容易生成含有错误信息的内容。

应对措施：跨学科合作，引入领域专家的知识和经验，提高系统处理复杂任务和专业性问题的能力。

（18）缺乏判断和道德考量：人工智能生成的内容往往缺乏人类的判断和道德考量，容易产生不恰当或冒犯性的内容。

应对措施：加入伦理规范和道德指引作为训练和生成模型的约束，确保生成内容符合道德标准和社会规范。

（19）知识共享和合作问题：人工智能生成的内容可能存在知识来源不明确和侵权问题，阻碍知识的共享和合作。

应对措施：建立明确的知识采用和引用规范，推动知识的合法共享和合作，保护知识产权。

（20）对用户隐私和个人信息的滥用[3]：人工智能生成内容的过程中可能涉及用户隐私和个人信息，存在滥用风险。

应对措施：加强隐私保护措施，确保用户自主控制和保护个人信息，明确使用目的和范围。

（21）潜在的误导性和欺骗性：人工智能生成的内容可能误导用户或有意欺骗，使其难以辨别真实与虚假。

应对措施：加强内容审核和监测机制，利用机器学习和自然语言处理技术识别和过滤可能的误导性和欺骗性内容。

（22）缺乏创意和想象力：人工智能生成的内容在创意和想象力方面有，难以创作出独特、创新的作品。

应对措施：结合生成算法和创意辅助工具，鼓励创作者与人工智能进行互动合作，激发创造性思维。

（23）著作权和版权问题：人工智能生成的内容可能存在著作权和版权归属问题，难以界定创作权的归属。

应对措施：制定相关法律法规和准则，明确人工智能生成内容创作权的归属，推动知识产权保护的适应性调整。

（24）知识盲点和限制：人工智能系统受限于其训练数据和算法，可能在特定领域的知识上存在盲点和限制。

应对措施：持续改进和丰富训练数据，扩展领域知识的覆盖范围，并与领域专家进行合作以获取专业知识。

（25）对语境和背景的不完全理解：人工智能生成的内容可能无法充分理解复杂的语境和背景，导致生成结果不准确或不理解用户需求。

应对措施：加强上下文理解和背景建模技术的研究，提高系统对语境的理解和响应能力。

（26）社会影响力和责任问题：人工智能生成的内容具有社会影响力，但由于缺乏人类道德和价值观，可能产生不良的社会影响。

应对措施：强调人工智能系统和相关技术的社会责任，制定道德规范和法律法规，确保生成内容的良性和有益性。

（27）难以处理复杂的多模态数据：人工智能系统在处理复杂的多模态数据（如图像、视频、音频等）时存在困难，导致生成内容的多样性和丰富性不足。

应对措施：进一步研究多模态生成算法和技术，提高系统处理复杂数据的能力，生成更丰富的内容。

（28）对难以量化的概念的表达困难：人工智能系统难以准确表达抽象、主观或难以量化的概念，导致生成内容缺乏深度和感觉。

应对措施：结合知识图谱和情感分析技术，加强对抽象和主观概念的理解和表达能力，提高生成内容的深度和感染力。

（29）潜在的人机交互问题：人工智能生成的内容在与用户的交互过程中可能存在理解和回应的不准确性，降低用户体验。

应对措施：不断改进对话系统和交互界面，提高人工智能系统与用户的互动能力，增强用户体验。

（30）复制和侵权问题：人工智能生成的内容可能过于模仿原创作品，涉及版权和知识产权问题，存在侵权风险。

应对措施：加强版权保护和侵权检测机制，利用数据比对和图像识别技术检测和预防内容的复制和侵权行为。

5 AIGC 面临的政策风险

（1）来自于国内法律规制：目前主要是在《网络安全法》《数据安全法》以及《个人信息保护法》的框架下,由《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理办法》、《科技伦理审查办法(试行）》共同监管AIGC 行业。

（2）国际方面：美国总统拜登8 月签署行政命令，该禁令限制美国投资者对中国半导体、量子计算和人工智能（AI）等敏感技术领域的新投资，并要求美企就其他科技领域的在华投资情况向美政府进行通报。该禁令表明对我国新技术采取更为严厉的管制措施。如果高性能GPU、CPU被限制出口，将严重影响我国AIGC的研究及应用进展。