ChatGPT生成式技术与供应链物流面临的智能变革
2023-09-20鲁维维
鲁维维
(太原学院管理系 山西 太原 030000)
0 引言
在供应链物流中,一直以来都存在着一些信息处理的难题。例如,在物流运输过程中,运输企业需要对新订单、运输计划、货车路线等信息进行处理和分发,同时还需要对运输过程中的异常情况进行实时处理。此外,供应链的参与者也需要协同合作,共同推进物流运输的进展。
而ChatGPT是一个基于深度学习的生成式预训练模型,它可以自动生成与人对话类似的自然语言文本,被广泛应用于包括自然语言生成、对话系统、聊天机器人等领域。因此,研究类ChatGPT的AI生成技术在供应链物流领域的应用,不仅能够推动供应链物流领域的智能化进程,还能在企业的业务处理和信息共享方面提供更加高效、准确的服务,有着非常重要的现实意义。
1 ChatGPT生成技术的原理及关键技术
1.1 ChatGPT生成技术的原理
ChatGPT是一种基于研究大规模上下文文本的自然语言处理技术,由DpenAI推出。该技术主要是基于开放域生成模型,即能够根据给定的文本生成相应的语言文本,同时还能对语言文本进行理解和回复。该技术通过与人进行交互,从而不断地学习、优化,并最终能够生成人类语言。ChatGPT的主要原理是通过模拟大量的文本数据集生成模型,能够从中学习和预测下一个单词或短语,从而生成完整的语句或段落。ChatGPT是生成式AI技术的代表之一,生成式 AI技术是一种基于机器学习和自然语言处理的技术,让AI模型学习语言的规律并产生新的符合文本语义的文本,用算法编程来进行智能语音交互,允许机器与人之间进行更加自然、个性化的对话。
1.2 ChatGPT生成技术的关键技术
ChatGPT作为一项新兴的人工智能技术,其本质是生成式AI技术。在实现这一技术的过程中,主要应用了以下几种关键技术。
1.2.1 算法
ChatGPT目前由GPT-4模型提供支持,生成式预训练转换模型(generative pre-trained transformer,GPT)是一种基于互联网可用数据训练的文本生成深度学习模型。ChatGPT模型从算法的分类来上来讲属于生成式大规模语言模型,底层技术包括 Transformer架构、有监督微调训练、人类反馈强化学习(Reinforcement Learning from Human Feedback,RLHF)等,ChatGPT通过底层技术的叠加,实现了组合式的创新。GPT模型采用了由Google提出的Transformer架构。Transformer架构采用自注意力机制的序列到序列模型,是目前在自然语言处理任务中最常用的神经网络架构之一。相比于传统的循环神经网络或卷积神经网络,Transformer 没有显式的时间或空间结构,因此可以高效地进行并行计算,并且Transformer具有更好的并行化能力和更强的长序列数据处理能力。
ChatGPT模型采用“预训练+微调”的半监督学习方法进行训练。第一阶段是预培训阶段。通过预训练语言模型,从大规模的数据文本中提取训练数据,再由深度神经网络技术处理,之后根据上下文的语义预测生成下一个词汇。第二阶段是微调阶段。将预先训练好的模型应用到特定的任务中,通过少量的标记数据来优化模型,从而提高模型的准确性和流畅性。
ChatGPT在训练中使用了RLHF。RLHF能对模型进行微调,并通过奖励机制对模型进行改造训练,让输出的结果更加流畅,更符合人类认知思维习惯。RLHF模型包括三个步骤:首先,按照预训练目标训练一个语言模型。其次,基于语言模型训练生成标注奖励模型,对模型生成的文本进行质量评价标记,标注环节目前由人工按照最好到最差的顺序进行标注,这样奖励模型就可以不断学习人类对文本内容的偏好。最后,将奖励模型输出的文本结果进行微调和优化,最终生成一个更符合人类偏好的语言模型。
1.2.2 算力
用于人工智能训练的计算能力一般符合摩尔增长定律,约20个月翻一番,深度学习技术的使用加速了人工智能训练算力的提升,用于人工智能训练的计算大约每6个月翻一番。而当前GPT模型的训练算力在原有的基础上又提升10~100倍的算力。OpenAI发布的LanguageModelsareFewShotLearners中提到,训练13亿参数的GDP-3 XL模型所消耗的计算能力约为27.5PFlop /s-dav。训练一个有1 750亿个参数的GBT-3模型将花费3 640 PFlop/s-dav,即以一万亿次/s的速度计算,需要3 640 d。由此可见只有投入极大的算力,才能保证GPT的使用效果。结合硬件设施投入看,一个典型的500P算力数据中心需要投资约为30亿人民币,而ChatGPT-3需要的总算力就为3 640PF-days,由此可推断,至少要7~8个这样的数据中心才能够用。因此,基础设施的投入是巨大的。
1.2.3 数据
从2018年发布的GPT-1到2023年的GPT-4, GPT模型参数数量和训练数据量都实现了指数级的增长。参数数量从GPT-1的1.17亿个增长到GPT-3的1750亿个,训练数据量从5GB增长到45 TB。目前GPT-4训练100万亿的模型,训练数据量就达到了约8 550 TB,是GPT 3.5的190倍。ChatGPT的成功依赖于算法、算力和大量的训练数据。而数据是我国的优势,我国拥有的数据量大且质量较高,因此,企业要应注重数据的保护和利用。数据就是资产,可以说数据就是未来生产力的动能。
从ChatGPT运作的技术保障系统来看,除前文论述的模型、算力和数据三大基础外,还需要部分软件、硬件及其基础设施设备支持的。如硬件方面,GPU和CPU芯片是关键。而芯片是我国的弱点,我国必须要加快芯片的设计制造能力。此外,ChatGPT的核心技术还依赖别的专业技术,如机器学习、神经网络等。目前,虽然我国在这些技术上在原创上有差距,但学习和应用能力较强,在语音技术等领域还具有自己的优势。在上述所有技术的加持下,才能得到GPT的语音交互、语言翻译、内容生成、搜索提取等功能,如图1所示。
图1 ChatGPT整体技术体系图
2 ChatGPT生成式技术给供应链物流带来的变革
ChatGPT技术与传统的问答系统相比,无需提前设定问题库或给予机器固定的单一回答。相反,它能够通过对前文的理解和对话双方的交互,自动进行问题抽象和回答生成,从而更好地实现智能化的对话。在供应链物流领域,这种技术可以很好地解决语言理解难题,并且可以让AI智能化地完成与客户沟通、数据处理、信息抓取和预测等任务,进一步提升供应链运作效率和准确性。目前从应用的方向来看,生成式AI技术带来的变革主要体现在以下几个方向。
2.1 物流系统流程自动化
ChatGPT生成式技术在供应链物流中的主要应用场景是流程自动化。企业需要不断收集、分析和处理各种形式的供应链信息,以更好地掌握市场动态,提高决策效率。生成式 AI 技术在自然语言处理和语音识别方面具有很高的水平,可以实现人机交互、信息抓取和数据分析等功能。这些技术可以帮助企业实现从物流沙盘模拟到物流组织与运营的全面协同,从而优化资源配置,提高服务质量。供应链物流环节的大量繁琐操作可以通过生成式AI技术实现自动化处理。例如,物流企业可以利用生成式AI技术更快地发现并准确找到需要的信息,如各国发布的空运或海运公司时间表、各国的海关信息、各个港口的设施设备等实用规范等。物流企业可以利用生成式AI技术自动创建采购订单或提前调度运输资源等,从而大大提高生产效率,降低成本。
物流企业还可将ChatGPT生成式AI技术与自有数据库结合,对在途货物和设备资源进行精细监控和定位,实现快速响应和调度,并实现更为精准的配送服务。生成式AI技术还可以生成实时的异常情况处理方案,并且可以综合各参与者的意见,为运输计划调整提供更有力的支持。比如,一家大型物流企业在系统中预设了各种问题类型,包括对客户订单的修改、运输过程中的异常处理,以及对货物拒收等。通过ChatGPT技术在少量数据学习后即可完成一系列反复出现的常规问题的解决,让系统自行生成相关的解决方案。从而提高物流运输的流畅度,缩短了运输时间,提高客户满意度。
2.2 物流系统决策分析及优化
ChatGPT生成式技术可以应用于物流系统的决策优化。供应链物流的运营涉及大量的跨区域调度,车辆、人员、物料等需要合理规划和配备。ChatGPT生成式 AI 技术可以通过对历史数据的分析和学习,自动化处理供应链物流环节中的数据分析、统计和计算等工作,快速识别变量、预测需求和制定运营计划,从而减少运营风险、提高效率和降低成本。例如,在库存管理方面。生成式 AI技术可以通过分析大量的历史数据来预测每种商品的需求量,并提供最佳的仓库分配方案,从而提高操作效率和服务水平。
2.3 客户服务问题处理
ChatGPT技术还可以帮助企业解决复杂的客户服务和问题处理问题。供应链物流中往往存在大量的投诉和纠纷,其中可能涉及运输延误、货物损坏、维修和退货等方面。生成式技术可以通过智能扫描和自动生成,快速生成客户服务建议和处理方案,使客户获得更好的服务体验,并增强企业品牌形象。
综上所述,ChatGPT技术可以在供应链物流的多个环节中发挥作用。根据具体场景,物流企业可以制定不同的应用模式,从而为客户提供更为优质高效的服务。
3 应用ChatGPT技术的局限性及风险
在供应链物流中应用生成式技术虽然能够提高物流效率和效益,但是该技术的使用也存在一些局限性和风险性。
3.1 成本问题
GPT模型的训练和使用需要巨量的算力,每一代GPT的升级,参数数量都在迅速扩大,所需要的预训练数据和成本也在迅速增加,由此导致GPT的使用成本很高。根据国大证券计算机分析师的分析,2023年1月ChatGPT每天约有1 300万的访问量,芯片需求量超过3万颗(英伟达A100gpu),前期初始投资约为8亿美元,后期运营的电费约为每日5万美元。这些投入成本,对于一些中小型企业来说,是不可能实现的。
3.2 技术问题
GPT模型目前有一些技术限制,例如不能很好地完成某些语言任务,或者在处理一些复杂的语言结构时遇到问题。此外,目前的数据分析技术水平有限,在数据分析和识别中可能会出现错误,从而可能导致供应链物流过程的混乱和损失,对企业和消费者产生不利影响。此外,由于ChatGPT是一种基于英语语料库训练的技术,在处理中文信息时存在一定的困难,需要进行语言转换和数据处理等操作,使得ChatGPT在中国的使用成本更高,难度更大。
3.3 安全问题
ChatGPT对信息、数据来源无法进行事实核查,可能存在个人数据与商业秘密的泄露或所提供的是虚假信息。另外,ChatGPT技术目前已经出现人类所不能理解的逻辑,未来是否会脱离人类控制,也是目前所担忧的问题。
3.4 法律问题
人工智能主要是通过挖掘人类日常交流以及文本,进而统计分析,因此,对于一些受著作权保护的文本、视频、代码等,如果没有经过权利主体的授权,直接获取复制到自己的数据库中,可能侵害他人的著作权。
4 推动ChatGPT生成式交互技术应用的建议
一是企业要主动融入ChatGPT浪潮,企业管理者要意识到 ChatGPT 时代的到来和给供应链带来的变革,鼓励企业将人工智能主导的内容创作变为公司核心业务的重要组成部分。
二是企业要重视历史数据的管理。ChatGPT的准确性取决于大量数据的训练,很多中小企业没有留存大量的历史数据或是无法访问数据,在这种情况下,ChatGPT的应用效果一定会大打折扣。所以建议中小企业战略上要注意数据的管理和积累。
三是中小企业可以从功能上的细分领域开始探索应用。ChatGPT成本投入巨大,目前来看,也确实只有科技龙头企业具有建立AI的能力,但龙头企业可以将其能力整合到搜索引擎、智能客服等产品线中,或通过能力租用为中小企业具体的场景落地服务。一些有实力的电商或物流企业,也可以尝试在模型功能上做细分,从成本较低的小模型做起,小模型成功后,再尝试做大模型。
四是注重员工培训和人才培养。从目前看,ChatGPT生成的回答内容的准确程度取决于员工在提出问题时,对问题描述的准确度。因此,这就需要企业加强对员工的相关培训,提高员工和ChatGPT的交互能力。
5 结语
以ChatGPT为代表的生成式人工智能的应用正在改变着供应链物流管理的运营方式,它的出现使得交互式人工智能的应用由专业型转向了通用型。ChatGPT生成式技术的使用可以提升物流系统的自动化水平、简化供应链成员间的沟通、辅助管理者做出有效的预测和决策,进而提高供应链物流的协同运作效率。在应用过程中,机会很大,但挑战和风险也不容忽视。研究者应扬长避短,让ChatGPT生成式技术更好地为企业服务。