AI训练师:让人工智能更“懂”人
2024-12-31彭欢雍娜吴晓玲曾锦熙
“人工智能一定要有人工才能智能。”罗兵是一名有7年从业经验的客服域AI训练师,他直言,在多数AI训练师看来,离开了人工,AI将不会存在。
喂养AI
AI行业是金字塔式构造,底部众多数据标注员是整个行业必不可少的基石,他们负责对人工智能做繁琐重复的喂养工作,这为整个AI模型提供了不可或缺的基础。不同于金字塔顶端的技术人员,数据标注员更像是喂养AI的“奶妈”。
“写几千、几万条问答,想让AI变得更聪明,只能靠人来喂数据。”这是婷婷入行后的感受,她需要为深圳一家互联网公司的虚拟主播做数据标注工作。
婷婷对公司正在做的AI产品进行描述时,语气中充满了憧憬:“那是一个可以实时演算、能在平台直播、能说会唱,还能智能回复弹幕的3D虚拟歌手产品。”但她也坦言,“实际情况是目前还没有做出来,或者说是现在的技术不足以支撑公司做出来。”
婷婷每天的工作内容很满:一方面要跟算法对接,做好demo测试和数据分析,组织负责内容创作的伙伴按算法要求打分,分析demo更新优化等;另一方面还要进行内容创作、调研、设计、营销等。
模型每天给婷婷“甩”过来上万条更新出来的文本问答,她需要一条一条地优化改写,紧接着还要进行评测,对AI的答案进行5分制打分,而且针对每一个答案都要给出具体判断标准。这让婷婷意识到,想让人工智能变聪明,只能人为给它喂优质数据。但是,这和她原本对AI行业的期待背道而驰。

出于对科幻电影、数码产品和游戏的兴趣,婷婷往这家人工智能公司投递了简历。她说:“当时的我觉得科幻片里的场景是可以实现的。”然而真正走进这个行业后,以往对AI行业的期待与现实状况产生了巨大落差。随着参与的深入,婷婷发现数据喂养工作具有极大的可替代性,目前国外已经出现了AI自动标注替代人工标注的案例。同时,行业内部也存在极大的壁垒:有的年薪百万,有的日结两百。
与婷婷的工作类似,沙柳也是一名数据标注员。作为一名自然语言大模型的数据标注员,沙柳每天的工作内容就是对模型进行提问,再将模型输出的回答进行标注。她需要标注出最佳答案来优化AI模型,不断地标注和训练是为了让模型能够在下一次的提问中给出更好、更优质的答案。
当然,评判答案的优劣并不是靠标注员的知识水平和主观感受,也无法人工写答案。“最优质的答案都需要去生成,有时还需要检验标注后的内容是否属实。”
但是,对于需要海量数据的模型来说,最主要的标注宗旨就是确保答案没有事实错误,其次才是答案是否扣题、表达了什么观点、对语言的理解能力如何、答案格式是否准确等。
这是一个高度重复性的工作,没有太高的技术含量。沙柳说:“标注工作需要耐心,本质上是一个很枯燥的工作。”如果全神贯注工作,每天的工作量5个小时就能完成,但也很费眼睛。
即便婷婷和沙柳都认为这是一份单调且繁琐的工作,但她们都无法否认其在行业内的价值:数据标注是整个模型不可或缺的基础。只要人工智能无法达到完全代替人的标准,标注工作就会永远存在。
这就是行业目前面临的困境:高可替代性,繁琐重复,却又不可或缺。
数据标注工作看似简单易上手,但又必须具备严谨的工作态度。比如,如果对自动驾驶领域的标注缺乏质量把控,那么就无法让汽车安全行驶在道路上。人工智能领域有一句流传甚广的话——人工智能行业有多少人工,就有多少智能。
人工智能行业的发展潜力无限,AI训练的基础是标注与喂养,这是打造AI的第一步。
“这是一个养孩子的过程”
2020年,AI训练师正式成为新职业并纳入国家职业分类目录。而在此之前,AI训练师在人才市场上的地位较为尴尬,既没有对口的专业,也缺乏相关的职业技能培训。
罗兵说:“7年前,我刚入行的时候,很多都是空白的,只能自己去摸索。”由于当时深圳的AI企业尚未发展起来,罗兵所在的公司只能从外地买回来一些机器人。“有不懂的地方,就请对方的产品经理或者训练师给自己做一些培训,不断重复这一过程后,就会对产品有一个基本认知,逐渐熟悉了操作训练机器人的后台系统,这样就算入门了。”

罗兵接触并训练过许多类型的机器人,而在客服域主要是文本机器人和语音机器人两种。例如,购物软件中的机器人能回答售前、售中、售后的系列问题;查询快递物流情况时输入单号,机器人就能调取包裹的物流轨迹,这些都是AI训练师训练机器人后的成果。通常,AI训练师需要根据应用场景和面向人群,搜集一些语料(即语言材料)后输入机器人模型中,并形成语料库。“我需要对机器人进行提问,判断它的回答对不对,如果不对的话,就要找出问题的原因并进行干预。”
罗兵需要在人工客服中收集用户咨询最多的问题,并将其进行归类,再来编辑话术,即人为地配置一些常用并且描述清晰的问题及其对应回答,再把这些问答“喂”给机器人。
当用户进行提问时,机器人会将用户的问题与所有配置好的问答进行相似度计算,找出最相似的问题,并返回答案给用户,这样就完成了一次问答操作。当用户提出的问题不在设定好的范围内时,就需要AI训练师去复盘总结,通过不断地复盘,让机器人尽可能回答用户的所有疑问。
把大量的数据“喂”给机器人,是深度学习的一环。深度学习是机器学习的一种,本质上就是让机器或者程序变成一个人,拥有人的技能,可以模仿或者创造一些人能做的事情。
曾在深圳一家互联网大厂实习了4个月的忆如,对“喂”机器人有通俗理解:“比如,告诉机器人1+1=2是对的,1+1=3是错的。然后,再告诉它3+3=6,如果机器人说等于5,那就给它打一个错误的标签,机器人就会继续学习;如果机器人输出的是6,那就证明机器人对这个任务能完成得比较好了。”
进行深度学习的过程,其实就是把大量的数据“喂”给机器或者程序,告诉它正确答案,让它不断学习,让它明白。
忆如实习期间的工作与游戏AI相关,他需要把王者荣耀中的“非玩家控制角色”(即NPC)训练得更加智能。怎样去躲避别人的技能防止自己掉血(指玩家角色受到攻击或受到特定条件影响而失去生命值)?怎样在自己不掉血的情况下让别人掉血?怎样更快地使用技能?这些都是忆如需要对AI进行强化训练的。
不同于罗兵需要把客服机器人训练得举一反三,忆如更偏向强化学习部分的工作,“不过,强化学习只针对某一个具体应用,让游戏AI会做一件或者几件事情,训练出来的也只是能跟用户对打的NPC。”
随着AI训练师被纳入国家职业分类目录,对该职业的考核标准也有了详细规定。
2022年,罗兵参加了深圳市人工智能训练师职业技能竞赛,并获得了三等奖。
想要获得职业认证证书,需要大量的职业技能培训。罗兵希望自己不局限于初级阶段的工作,他不断提升工作能力,学习更多的技能。他把自己达到一定水平后训练AI的工作,比作一个养孩子的过程,“因为这时候我能参与制定一些规则、搭建一些模型,机器人完全是根据我的想法去做的,这些机器人就像我的孩子一样,它能成长到什么地步完全取决于我。”
“关关难过关关过”
未来,人工智能将在各个领域得到更深入更长足的发展。在这个过程中,AI训练师扮演着重要角色,他们的工作对于机器学习模型的优化和精准性有着决定性的影响。
然而,与日渐增长的市场需求相比,专业AI训练师的缺口还是有些大。罗兵解释说:“现在特别缺行业类的训练师,比如金融类的训练师,既要懂金融相关知识,又要懂文本训练,还要懂机器人训练,这几者要兼得其实是很难的。”这就造成了一种尴尬境地:一面是大量的人才缺口,一面又是怎么都递不过去的简历。
不过,在罗兵看来,人工智能未来的发展形势一片大好。他说:“很多企业都需要客服,以前是通过人力不断地去补充,现在虽然有了机器人,不过肯定还是需要一两个人长期去运营,而这一两个人是不会频繁更换的。”
也就是说,无论人工智能如何发展,机器都无法代替人类。“所谓人工智能,先有人工才会有智能。模型、规则都是人做的,机器是不可能取代人工的,否则人的存在就没有意义了。”罗兵说。
沙柳同样认为,人工智能与人工是相辅相成的,不会因为人工智能的发展而导致人类没有工作可干。
为了更好地发展人工智能,国家出台了一系列针对AI训练师的政策。罗兵说:“深圳的人工智能协会,定期会举办一些公益培训活动,培训完的AI训练师还能拿到政府的补贴和颁发的证书。”
人工智能未来将如何发展,能够发展到什么程度,或许我们都无法准确预测,但毋庸置疑的是,它正在深刻影响着我们。各式各样智能化服务的出现,给我们的生活、工作等各方面带来了诸多便利。
未来,随着人工智能技术的不断发展和应用,AI训练师的工作将充满挑战和机遇。“做AI训练师就像打游戏闯关,你能通过不断提升,从而获得成就感。”今后,罗兵也会继续在这条赛道上“关关难过关关过”。
责任编辑:丁莉莎