以“决赛思维”应对ChatGPT引发的“新人工智能时代”四大挑战

2023-06-08张林山李叶妍

中国经贸导刊 2023年5期

张林山　李叶妍

ChatGPT是由美国OpenAI公司研发生成的一款基于AIGC（AI Generated Content，即利用人工智能技术生成内容）人工智能大模型训练的聊天机器人应用。该应用以对话交互方式为主，引发了现象级的全球关注，掀起新一轮人工智能浪潮。

一、ChatGPT将引发众多行业深刻变革

当前，人工智能大模型技术及产业发展成为我国科技巨头竞争和社会各界讨论的焦点。可以预见，人工智能大模型应用将给社会生产和生活带来重大影响和深刻变革。

（一）人工智能产业将从“手工作坊时代”进入“工业化大生产时代”

在人工智能大模型出现之前，各研发主体基本上是针对特定的场景开发特定的人工智能模型，如人脸识别算法公司主要涉足在线支付领域，智能语音算法公司主要涉足客服领域。单一人工智能场景一般需要一个专门的模型算法团队进行定制化研发，整个产业基本处于“手工作坊”时代。进入大模型时代后，由于大模型的参数规模是传统小模型的一万倍以上，一次完整的模型训练成本高达数千万近亿元人民币。同时，大模型各生产环节的分工也更加细化，如OpenAI公司就大量引入外包员工完成数据标注处理工作。大规模、高成本、精细化使得人工智能大模型产业呈现出“工业化大生产”的基本特征。

（二）人工智能大模型将成为新的基础设施并构建新的生态体系

人工智能大模型具有跨领域与跨行业的特征，其应用生态体系已开始逐步建立。人工智能大模型作为新的基础设施MaaS（Model as a Service，即模型即服务），可以在2C（消费）、2B（公司）、2G（政府）等领域全方位应用，推动智慧化信息化水平提升，其本身可能发展成为继移动互联网之后新的技术平台。未来，待技术和市场进一步成熟后，“人工智能+”将同“互联网+”一样衍生出同各行各业深度融合的新模式，带来教育、医疗、能源、制造、金融、传媒、电子商务、战略咨询、政务服务等领域新的发展。人工智能大模型及“人工智能+”作为人机交互的新桥梁，可能会带来新一轮人工智能技术的普及和市场的繁荣。

（三）人工智能大模型将引领新一代信息技术革命和产业变革

对于软件产业，ChatGPT可以根据用户输入的文本提示直接生成和推荐代码，这会导致从业者越来越依赖人工智能大模型编程并逐步取代人工编程。对于云计算产业，亚马逊AWS平台和阿里云平台分别借助两国移动互联网发展浪潮形成了先发优势，而人工智能大模型的出现可能导致行业重新“洗牌”。对于芯片产业，人工智能大模型会加速其向专用芯片方向发展，亚马逊、微软、谷歌以及国内的阿里云、华为云都针对人工智能大模型推出了专用芯片。对于电子商务产业，基于深度学习的人工智能大模型，电商将有能力根据客户喜好直接生成内容，诸如生成商品描述信息、推出人工智能导购服务等。

（四）人工智能大模型将对国家安全和意识形态安全构成潜在威胁

海外ChatGPT模型主要基于海外文本数据进行训练，其中包含部分涉政、涉恐以及西方意识形态引导的相关信息。若用户频繁使用海外ChatGPT类产品进行辅助办公、教育学习、趣味闲聊等，将造成不可控的不良内容传播风险。ChatGPT的模型数据中，以英文世界的数据为主，因此其产生的“共识”也可能仅仅是部分人或者某种意识形态下的“共识”，而非全人类的“共识”。从测试结果看，ChatGPT会刻意回避对某些敏感人物和敏感事件的评价，但是考虑到交互内容的长尾效应，ChatGPT的回答可能包含出于政治目的发表、与事实不符的言论。

二、新一代人工智能是新一轮科技竞争的制高点

目前，和发达国家相比，我国在大模型技术及产业发展方面存在一定差距，但具备相当的技术和基础储备，有能力获得新一轮科技竞争的“决赛入场券”。

（一）我国算力支撑和算法创新能力与国外存在差距，“卡脖子”问题突出

我国在人工智能大模型技术支撑层面与发达国家相比存在差距。一是我国算力建设不足。国外在人工智能算力平台、模型开发、开放平台建设方面起步早、投入大，为大量研究者、投资者参与大模型技术研发和产业落地提供便利。同时，受GPU芯片等“卡脖子”技术限制，国内算力建设发展相对滞后，头部企业算力和谷歌等国际巨头相比明显不足。二是算法创新能力受限。目前，ChatGPT背后的算法模型、关键核心技术全部是国外公司或科研机构研发的，我国在算法创新和原创性基础研究方面还存在较大差距。

（二）大模型训练过程中，中文数据质量水平相比英文数据还有明显不足

在人工智能大模型训练过程中，中文数据质量与英文数据质量相比存在明显不足。造成这一差距的主要原因在于用于大模型训练的数据主要从互联网上抓取，而中文互聯网现在缺少很多“小而专”的网站或专业论坛，也缺乏诸多组织协同共建、开放可用的数据集。整体来看，中文互联网数据相比英文互联网数据普遍表现出专业性条理性弱、优质数据少，而广告盈利性强的特质。未来在我国互联网环境下训练人工智能大模型，面临中英文互联网语料互补、语境互通的难题。

（三）欧美企业在大模型及其试验方面更领先，我国企业则面临技术研发推广的巨大风险

ChatGPT首先在海外爆发是欧美企业长期投入积累形成的。国外较早开始推广人工智能大模型生态，并在相关产业落地过程中获得了较多的客户反馈和数据反馈，从而实现模型效果持续优化。例如，OpenAI公司成立至今，在创新投入、人才储备等多个方面长期进行巨额资金投入以及包容试错，才实现了关键技术突破。而我国企业大模型研发推广和产业落地速度整体落后于海外，在上述这些方面还有诸多不足。虽然百度、阿里、腾讯、京东等互联网头部企业均发布消息称已开展相关技术研发或部分模型已进入内部测试阶段，但大模型的训练成本较高，技术应用面临着亿元级研发投入和海量训练试错。

（四）我国具备相当的技术和基础储备，有能力获得“决赛入场券”

在发达国家不断进步的同时，我国也在持续发力。一是我国可供人工智能大模型技术应用的场景广泛且用户市场广阔。我国互联网和人工智能产业具有服务亿级用户产生的海量数据和多元场景，可以直接转化为大模型技术发展和行业竞争的绝对优势。我国互联网平台企业持续在人工智能大模型技术研发方面投入，推出极具竞争力的算力平台和算法团队。二是丰富的中文数据资源和中文语境塑造了我国人工智能大模型技术和产业发展的差异化优势。我们可以利用大量的中文语料资源训练模型，从而增强模型的适用性和准确性。针对中文语境，我国自主研发大模型的表现水平要远高于国外模型水平。因此，我国具备相当的技术和基础储备，只要持续探索创新，就不必担忧同发达国家的差距进一步扩大，就有足够的实力参与国际竞争。

三、以“决赛思维”应对“新人工智能时代”挑战

要充分认识到应对“新人工智能时代”挑战的必要性和紧迫性，加大对重点企业和研究机构的支持力度，加速国产大模型及综合应用面市，鼓励“人工智能+”应用场景融通创新，多举措加强数据和技术监管，引导人工智能大模型产业安全健康可持续发展。

（一）认识层面：要充分认识到应对新挑战的必要性和紧迫性

一是要认准大势，主动求变应变，牢牢把握我国人工智能发展的重大战略机遇。从思想认识上，要高度重视“新AI时代”对我国科技跨越发展、产业优化升级和生产力整体跃升的重要影响。要充分认识到“新AI时代”人工智能将具有更强的“头雁”效应，必须紧紧抓住这一战略机遇，从基础理论、核心技术、关键产业、重要要素等层面，积极构建适应新形势新需求的科技创新体系。

二是要直面挑战，增强忧患意识，尽快“自上而下”进行系统性战略布局。要立足国家发展全局，结合我国产业发展实际需求，找准突破口和主攻方向，整合优质技术和资源，充分发挥我国体制机制、市场规模等多重优势，以“决赛思维”迎接“新AI时代”的挑战。

（二）产业层面：加大对重点企业和研究机构的支持力度，加速自主创新的国产大模型应用面市

一是要出台更多支持人工智能大模型产业发展的政策举措。制定相关技术标准和行业规范，加大对头部企业开展大模型核心技术攻关的支持力度，发挥重点企业和研究机构的数据、算力、算法和人才优势，联合产业链上下游企业、高校院所、国家重点实验室、新型研发机构，协同开展科研攻关，加快推出国产大模型拳头产品。

二是着力促进大模型技术创新创业生态优化。提高人工智能大模型产业链上关键基础设施的自主可控程度，包括深度学习框架、人工智能芯片、模型训练平台等，通过政策扶持、产业基金、创业孵化等方式带动前沿技术应用，加速技术成果转化和产业落地。

（三）应用层面：鼓励“人工智能+”应用场景融通创新，提升社会各界对大模型技术工具的认知水平

一是要充分发挥我国海量数据和应用场景优势，推动“人工智能+”发展。鼓励有关部门提供政务服务、交通、教育、医疗等公共服务中涉及内容生成、人机交互的场景，通过“揭榜挂帅”“赛马”等制度，鼓励具有一定条件和实力的企业使用更多场景应用自主研发大模型产品及相关服务。

二是有必要向大众宣传普及人工智能大模型技术的相关知识和理念。让大家既重视对新技术的学习和使用，又不畏惧新技术的融入和替代。正确认识大模型工具的价值，明白它们可以成为人类专业的助手，可以为工作和生活减轻负担、提供便利。积极缓解和应对技术焦虑，缩小技术不平等性可能导致的社会差距，在深度学习和智慧化方面实现全社会各行业跨越式进步。

（四）监管层面：多举措加强数据和技术监管，引导人工智能大模型产业安全健康可持续发展

一是要创新监管理念和手段，为新业态留足发展空间。构建相关方共同参与的协同治理体系，在技术和模式创新过程中实现规范与发展的动态平衡，一时看不准的，可给予一定时间的观察期。支持人工智能计算中心、超算中心、“东数西算”枢纽等汇聚成网，推动算力共享，完善数据流通利用规则，制定数据资源开放清单，开展数据资源开放试点，区分“技术研发场景”和“技术应用场景”，扩大面向人工智能大模型的公共数据供给范围，有序开放公共数据库、专业数据库等，优先开放高价值、低敏感、数据量大的民生公共数据。

二是要建立健全大模型技术及应用过程中的知识产权、伦理和安全监管机制。监管部门要结合技术创新应用情况，动态制定人工智能知识产权与数据权益保护规则，深入推进人工智能伦理治理，并严格把控信息安全，限制重要机构和组织使用ChatGPT类海外产品，以免造成重要信息泄露风险。

〔張林山，国家发展改革委体管所研究员。李叶妍（通讯作者），国家发展改革委体管所副研究员〕