大模型技术在企业科研项目管理中的应用研究
2024-09-26刘茜杨修通
摘要:针对当前企业科研项目管理中存在的监管难、质量差、效率低等问题,提出应用大模型技术赋能企业科研项目管理。设计基于大模型技术的企业科研项目管理系统应用架构和智能科研管理助手,并对大模型技术在企业科研项目管理全生命周期中的应用进行分析。以智能问答系统流程为例,具体介绍大模型技术在企业科研项目管理中的应用场景,为企业在科研项目管理中应用大模型技术提供参考。研究表明,将大模型技术应用于企业科研项目管理,有助于企业降低项目管理风险,大幅提高企业科研项目管理智能化水平和管理效率。
关键词:人工智能;大模型技术;企业科研项目管理;智能科研管理助手;智能问答
0引言
随着企业科研项目投入逐年增加,科研项目管理的战略地位不断提高。当前,企业科研项目管理过程中人员结构复杂、业务流程烦琐、资源分配困难的特点与传统科研项目管理模式矛盾突出[1]。企业科研项目管理智能化水平较低,管理过程信息流通困难,参与各方容易产生信息孤岛。同时,由于缺乏科学的管理系统和完备的管理策略,管理质量差、效率低等问题不断显现。虽然部分企业引入了一些管理工具,但是缺乏核心工具,且众多管理人员缺少使用经验,严重影响了科研项目管理工作的开展。因此,如何通过先进技术手段提升企业科研项目管理过程的便利性和管理质量,是当前急需解决的问题。
大规模预训练语言模型(Pretrained Language Model,PLM),也称“大模型”,是一种具有战略性、前瞻性的新兴技术,具有规模性、涌现性及通用性等特性[24],可实现海量数据信息的分析、处理,并为用户提供智能问答、辅助决策、文本生成等能力。因此,将大模型技术应用于企业科研项目管理中不仅能够有效规避项目风险,增强企业研发投入收益,而且能够为企业的发展规划提供真实可靠的数据支撑和科学客观的决策依据。本文通过对企业科研项目管理现状进行深入剖析,提出应用大模型技术赋能企业科研项目管理,设计基于大模型技术的企业科研项目管理系统应用架构和智能科研管理助手,旨在为提升企业科研项目管理智能化水平和管理效率提供新方向。
1各行业大模型的发展及应用概述
随着ChatGPT等强大的人工智能产品的问世,大模型技术得到社会各界的广泛关注。2022年,人工智能领域的知名创业公司OpenAI发布了人工智能聊天机器人ChatGPT[5],该产品上线两个月用户数量就达到1亿人,成为全球估值最高的初创公司[6]。ChatGPT凭借其出色的语言理解、生成能力和逻辑推理能力引发了各界的广泛关注[79]。继OpenAI推出ChatGPT后,国外各科技公司纷纷推出各自的大模型产品。微软公司在Bing搜索引擎的基础上增加了一系列创新功能和改进,形成了为用户带来更高效、更智能的搜索体验的New Bing,并宣布计划将ChatGPT集成到Word、PowerPoint、Outlook等软件中[10];谷歌推出Bard拓展程序(Extensions),该程序集成了Gmail、Docs、Google Drive、Google地图、YouTube等多款谷歌应用;苹果、亚马孙、Meta等企业积极布局人工智能的开发战略。国产大模型在2023年呈现出爆发式增长。百度公司率先发布生成式AI产品“文心一言大模型”,随后,阿里巴巴“通义千问大模型”、华为“盘古大模型”、腾讯“混元大模型”、科大讯飞“星火大模型”、京东“言犀产业大模型”、商汤“日日新大模型”[11]等国产大模型相继发布或正在研发中。据统计,2019—2023年7月,全球共有268个大模型问世,其中,我国共发布130款不同类型大模型[12]。2019—2023年7月国内外大模型发布数量情况如图1所示。
经过近几年的大模型迭代和发展,不同领域的大模型技术布局已初见成效[1316]。在教育领域,大模型技术可以提高学生的学习效率和教师的教学质量,丰富教育内容及教学形式,为教育领域带来新的可能性和机遇;在医疗领域,大模型技术可以实现医学图像诊断疾病、预测病情的发展趋势,为医疗行业提供重要的辅助决策依据;在金融领域,大模型技术能够通过分析大量的市场数据预测市场走势,识别投资风险,为投资者提供投资决策参考;在交通领域,大模型技术可以实现流量预测、拥堵原因分析并优化交通道路布局,为交通管理部门提供决策支持。
2企业科研项目管理大模型
21企业科研项目管理面临的问题
企业科研项目管理涉及多个部门协同,人员的复杂性进一步提升了科研项目管理难度[17]。在传统管理模式下,企业科研项目管理存在三大问题,具体如下:
(1)缺乏顶层规划,科研资源分配不合理。部分企业在实际工作中存在盲目追求科研项目数量,缺乏顶层规划,大量科研资源耗费在前期项目申报过程中。同时,随着项目数量的不断增加,科研项目管理难度大幅提升,当企业多个项目同时开展时,极易发生科研资源配置冲突,出现人员调配、经费投入、工时安排、设备资源等分配不合理的现象,进而影响科研项目的完成质量及管理效率。
(2)市场意识薄弱,科研成果转化困难。现阶段,企业科研项目管理工作的核心仍停留在项目任务表面,管理人员相关专业知识和技能储备不足,缺乏效益意识和竞争意识,导致科研项目成果难以转化为现实生产力和经济效益,无法保证科研项目的规划科学性和实施稳定性,从而降低企业的核心竞争力,阻碍企业繁荣发展。
(3)数据动态管理不足,存在数据孤岛现象。随着企业科研项目数量逐年递增,项目复杂程度不断增加,部分企业缺乏科研项目数据信息动态管理,导致数据信息不能充分收集,关键细节易被忽略,存在数据孤岛现象;缺乏信息管理平台,各项目成员沟通效率低,存在信息交流障碍;数据动态管理不足,无法保障信息的及时性。
22基于目的导向的企业科研项目管理大模型
建设企业科研项目管理大模型系统,首先应充分考虑企业项目管理模式的特点和企业的发展经营目标,进而明确本系统所需功能。结合当前企业科研项目管理存在的普遍问题及大模型的优势,建设方针上应基于三个目的:一是进行项目规划布局,统筹规划项目资源,助力企业价值创造;二是预测行业发展及市场趋势,智能评价项目完成度,建立成果转化机制;三是获取内外部数据,搭建实时数据平台,优化协同管理模式。构建基于目的导向的企业科研项目管理大模型,不仅能实现科研项目管理全生命周期的跟踪溯源,为管理人员提供更加直观、真实、全面准确的项目数据,而且能提供先进管理工具,减轻管理人员负担,增强企业员工对管理体系的满意度和认同度,进而提升企业科研项目管理效能,因此,大模型技术为解决传统科研项目管理面临的瓶颈问题提供了新的方向。
3企业科研项目管理大模型的构建
企业科研项目管理大模型的构建需要经过预训练和微调两个阶段。在预训练阶段,从大规模无监督数据中学习科研项目管理相关知识;在微调阶段,将少量的标注数据灌注到目标需求中进行监督训练[1819],经过离线推理、在线部署,最终形成企业科研项目管理大模型。
本模型建设将从企业科研项目管理实际出发,融合基础信息网络,建设市场分析、战略决策、组织管理、人事管理、财务管理、采购管理、智能审核等业务应用场景,打造智能科研管理助手,形成辅助决策、智能问答、文案生成等创新能力。企业科研项目管理大模型总体架构如图2所示。
企业科研项目管理大模型以实现企业数字化、智能化为建设目标,采取4层结构设计,包含基础支撑层、资源要素层、模型训练层、能力生成层。其中,基础支撑层为模型提供基本规则约束,保证整个模型的建立及运行合理合规;资源要素层是模型应用的基础,以数据中台作为数据底座,为模型训练提供项目数据、成果数据、历史数据、财务数据、互联网数据、领域数据、人力数据及实时数据;模型训练层主要用于开展大模型的训练;能力生成层主要为用户提供各种科研项目管理相关的创新应用。业务网络为整个系统提供网络传输条件,保证系统数据能够不断更新迭代。
模型训练层分为三个阶段。第一阶段,基础大模型(H0)训练阶段,直接使用数据底座提供的通用数据进行训练,整个训练过程以无监督预训练的方式进行,该模型能够提供对话问答、代码编辑、语义分析、任务规划、内容生成等通用能力。第二阶段,行业大模型(H1)训练阶段,引入部分科研项目管理行业知识数据对模型进行有监督微调,使模型初步具有人类意图,具备生成高质量答案的能力。第三阶段,企业科研项目管理大模型(H2)训练阶段,引入企业科研项目管理具体业务场景数据,训练过程采用基于人类反馈的强化学习方法(Reinforcement Learning from Human Feedback,RLHF)[2021],利用人类反馈提升模型性能,使模型完全能够识别人类意图,得到精准答案。
4大模型技术在企业科研项目管理全生命周期中的应用
企业科研项目的全生命周期管理是指从项目建议、立项论证、组织实施、检查评估、结题验收、成果申报、成果转化、推广应用、后评价到档案归档的全方位、全过程、全要素管理,主要包含科研规划、项目立项、项目实施、项目验收、成果管理5个阶段[22]。大模型技术在企业科研项目管理全生命周期中的应用设计如图3所示。
根据图3可知,企业科研项目管理大模型为技术专家、管理人员和项目负责人提供了一个自动更新、使用便捷、内容丰富的智能科研管理助手,能够实现对科研项目全生命周期进行科学管控。智能科研管理助手可以帮助项目相关人员对科研项目管理全生命周期中的各种因素进行分析、处理和预测,提供更加精准的决策支持,保证项目进展顺利;同时,还可以根据使用人员的反馈情况,不断优化和完善,保障管理过程更加精细化、智能化。智能科研管理助手主要具备如下6种能力:
(1)智能决策。通过对企业科研项目的历史数据、实时数据及行业相关互联网信息数据进行深度挖掘和分析,辅助管理人员制订更加科学的计划和决策方案;实现对行业未来发展趋势的预测,帮助企业提前开展行业布局,为企业科研发展方向提供参考。
(2)资源调度。通过对项目需求、项目进度状态、采购计划等信息进行综合分析,快速生成初步调度方案,辅助管理人员制订全面、科学、准确的科研项目资源分配方案,实现经费、人员、设备、材料等科研项目资源的高效分配,从而保证科研项目实施过程计划的稳定性和持续性,保障科研项目高质量完成。
(3)智能协同。在科研项目管理过程中,绝大多数任务场景都需要不同角色人员共同协同完成,人员和流程的复杂性极易造成科研项目管理混乱,导致任务完成效率降低。大模型技术能够对企业相关管理制度、体系文件、实施计划进行自动拆解,根据任务场景,自动生成协同方案,并使项目相关人员按照该方案进行工作,从而有效规避因流程混乱造成的风险,保障各个项目执行环节高效运行,进而提升科研项目管理效率。
(4)成果评价。通过对历史成果评价案例、行业专家知识、专题库数据等进行综合分析,形成成果评价模型,提供从多个维度对项目成果进行评价的能力。同时,通过与行业同类成果进行对比分析,实现对项目成果质量的综合评估和效益预测。此外,在成果评价基础上,实现成果与市场的供需匹配,使科研成果与市场需求紧密结合,提升需求方的采购效率,扩充供应方的销售渠道,促进成果的快速转化应用。
(5)实时展示。大模型技术强大的数据处理能力,能够实现企业科研项目管理过程中数据的快速整合分析,生成科学、真实、可靠的统计数据,并实现文本、图像、表单等形式可视化管理,内容包括经费执行率、计划完成情况、风险识别情况、项目进度等,极大地减轻了管理人员负担,大幅提高了科研项目管理效率。
(6)培训教育。当前,企业培训教育通常采用教材自主学习、讲师现场培训等传统方式,学习效果有限,且耗费大量时间及人力成本。大模型技术可根据人员岗位特征和技术水平,采用启发引导式提问,判断被培训人员的实际业务水平及培训需求,对被培训人员进行个性化互动探究式培训,并能够根据被培训人员反馈的学习情况及时进行培训内容调整,生成定制化培训方案。此外,其还可对被培训人员的培训成果进行个性化考核评价,考评结果更加客观准确。
5案例分析
以企业科研项目管理智能问答系统流程为例,对大模型技术在科研项目管理中的应用进行具体介绍。企业科研项目管理智能问答系统流程如图4所示。
该系统流程包括问题输入、自然语言处理、信息检索、模型训练、答案输出5个过程。具体智能问答系统流程如下:
(1)用户提出问题后,通过自然语言处理(Natural Language Processing,NLP)[23]技术,同时结合语义库数据,对问题文本进行信息处理,将人类语言转化为机器语言,实现人机交互。
(2)通过大模型意图识别工具,在标签化数据库中检索与问题相关的知识数据,以提示的方式和问题一起输入大模型,且通过大模型训练生成意向答案,意向答案进入满意度评价模型进行满意度评价,模型不断进行训练迭代,直至生成符合满意度标准的答案。
(3)经过自然语言处理编辑生成自然语言回答,输出答案。
在实际应用时,大模型需要提前进行大量训练,其训练结果的稳健性直接影响模型的泛化能力,是评价大模型系统性能的重要指标。对于本文构建的企业科研项目管理大模型,其稳健性主要体现为相同输入条件下能够得到相对稳定的输出结果。为提升模型的稳健性,每次模型训练后,都需对训练结果进行评估,并根据评估结果对模型参数和训练策略进行调整,最终得到相对稳定的输出结果。对于已训练成熟的企业科研项目管理智能问答系统,当管理人员提出的问题为客观问题时,如询问某项目经费执行率时,模型内部能够快速识别用户意图,通过对海量数据库进行快速检索,抽取出关键字段信息,并经过一定的加工组合后,即能直接得到经费执行率的具体数值;当所提问题为主观问题时,如询问某项目继续执行是否具有进度风险时,大模型通常会参考同类项目历史执行情况、项目负责人情况及当前项目执行情况等各类因素,进行综合分析后,得到相关分析报告,但是,模型内部不断更新迭代,通常再次提问该问题时,所反馈的结果在语言描述上仍然会存在轻微差异。
6结语
本文通过深入剖析当前企业科研项目管理过程中存在的问题,设计了基于大模型技术的企业科研项目管理系统总体架构,同时对大模型技术在科研项目管理全生命周期各阶段中的应用展开了分析,并以智能问答系统为例,介绍了大模型技术的具体应用流程。研究表明,大模型技术应用于科研项目管理的各个阶段,能极大地提升科研项目管理的智能化水平和管理效率,有利于促进科研项目管理的创新发展。但由于大模型技术的应用依赖于大量数据支撑,在引入大模型技术前,企业应提前建立完善的数据管理体系,为模型训练提供数据质量保障。同时,企业还需组织人员进行相关技能培训,并定期对模型使用效果进行评估,推动模型得到持续优化,从而达到用户的应用需求。
虽然大模型技术具有广阔的应用前景,但是其作为新兴技术在企业科研项目管理领域落地实施还面临较大的挑战。例如,数据安全、训练成本、设备维护等。另外,大模型技术的更多应用模式还有待更深入的探索。例如,探索将大模型技术与虚拟现实技术相结合,构建虚拟仿真环境,将培训人员带入真实的操作场景,进而提升培训效果和项目人员的技能水平。
参考文献
[1]张骅基于科研项目管理的计算机信息系统开发研究[J].电子元器件与信息技术,2021,5(6):188191
[2]刘学博,户保田,陈科海,等大模型关键技术与未来发展方向——从ChatGPT谈起[J]中国科学基金,2023,37(5):758766
[3]刘静,郭龙腾GPT4对多模态大模型在多模态理解、生成、交互上的启发[J]中国科学基金,2023,37(5):793802
[4]BOMMASANI R,HUDSON D A,ADELI E,et alOn the opportunities and risks of foundation models(20210816)[20230817]https://arxivorg/abs/210807258
[5]OUYANG L,WU J,JIANG X,et alTraining language models to follow instructions with human feedback[J]Advances in Neural Information Processing Systems,2022(3):27730—7744
[6]赵红勋,郭锦涛,李孝祥人工智能时代人机关系的变革逻辑——基于ChatGPT应用的学术考察[J]中国传媒科技,2023(2):1318
[7]赵志枭,王东波数字化时880e8fb82461beccef2cd2fe8750b43743ce7aad34220f19de4b0e5ec821a646代下ChatGPT的开端、发展和影响[J]科技情报研究,2023,5(2):3747
[8]杨磊大模型的基石——Transformer框架[J]中国信息技术教育,2023(7):8690
[9]吴砥,李环,陈旭人工智能通用大模型教育应用影响探析[J]开放教育研究,2023,29(2):1925,45
[10]孙小程,罗茂林GPT4迈入应用层多家公司回应商业化进度[N]上海证券报,20230318(5)
[11]崔亮亮逐鹿大模型:从通用到专用[N]通信产业报,20230619(3)
[12]人工智能产业研究中心2023大模型现状调查报告.(20230824)[20240824]https://baijiahaobaiducom/s?id=1775063259580702525&wfr=spider&for=pc,2023
[13]严昊,刘禹良,金连文,等类ChatGPT大模型发展、应用和前景[J]中国图象图形学报,2023,28(9):27492762
[14]陶建华,聂帅,车飞虎语言大模型的演进与启示[J]中国科学基金,2023,37(5):767775
[15]KRIZHEVSKY A,SUTSKEVER I,HINTON G EImageNet classification with deep convolutional neural networks[J].Communications of the ACM,2017,60(6):8490
[16]MIKOLOV T,SUTSKEVER I,CHEN K,et alDistributed representations of words and phrases and their compositionality [J]Advances in Neural Information Processing Systems,2013(26):31113119
[17]刘春洁加强高校科研经费管理的意义及对策[J]中国高校科技,2017(4):2425
[18]张潇霄,王煊,王磊,等基于预训练语言模型的管制信息抽取方法[J]指挥控制与仿真,2023,45(2):107111
[19]LONGPRE S,HOU L,VU T,et alThe flan collection:designing data and methods for effective instruction tuning(20230131)[20230817]https://arxivorg/abs/230113688
[20]郭全中,张金熠ChatGPT的技术特征与应用前景[J]中国传媒科技,2023(1):159160
[21]CHRISTIANO P F,LEIKE J, BROWN T,et alDeep reinforcement learning from human preferences[J]Advances in Neural Information Processing Systems, 2017(12):4302—4310
[22]张铁男,张亚娟,杨亦可,等航天科研生产全面内部监督机制研究[J]航天工业管理,2007(1):4144
[23]张鹤译,王鑫,韩立帆,等大语言模型融合知识图谱的问答系统研究[J]计算机科学与探索,2023,17(10):23772388
收稿日期:20240409
作者简介:
刘茜(通信作者)(1992—),女,工程师,研究方向:科研管理、力学测试。
杨修通(1991—),男,工程师,研究方向:科研管理。