给AI装上“语法识别器” 阿里达摩院在自然语言理解大赛中夺冠
2020-03-25
中国计算机报 2020年9期
近日,在全球自然语言处理领域顶级赛事GLUE Benchmark中,阿里巴巴达摩院以平均分90.3分的成绩夺冠,战胜了来自Google、微软、Facebook、斯坦福大学等企业和高校的团队。自然语言理解是人工智能的核心技术之一,GLUE Benchmark(通用语言理解评估基准)比赛排名是衡量自然语言理解技术水平的重要指标。比赛设置了自然语言推断、语义相似度、问答匹配、情感分析等9项任务,最后按平均分综合排名。
达摩院NLP团队取得了CoLA、MRPC、QQP、WNLI等4个任务的最佳效果,以平均分90.3分位列第一。据了解,目前,阿里AI的表现已经超越了人类水平(87.1分)。早在2018年初,阿里AI就在機器阅读理解顶级赛事SQuAD中打破世界纪录,首次超越人类成绩。2019年,阿里AI登顶GLUE榜单,并于同年6月在常识QA领域的权威数据集CommonsenseQA中夺冠,刷新了MSMARCO文本阅读理解挑战赛的纪录。
据介绍,达摩院NLP团队此次开发的StructBERT模型好比给机器内置了一个“语法识别器”,使机器在面对语序错乱或不符合语法习惯的词句时,仍能准确理解并给出正确的表达和回应,大大提高机器对词语、句子以及语言整体的理解力。目前,这一技术已广泛使用于阿里旗下阿里小蜜、蚂蚁金服、优酷等业务。阿里达摩院的语言模型和阅读理解技术也被用于行业赋能,推进AI技术在医疗、电力、金融等行业的落地。