APP下载

先声智能:用人工智能打通K12语音识别市场

2020-09-26牛妤坤

创业邦 2020年9期
关键词:编码器口语人工智能

牛妤坤

先声智能联合创始人兼CEO 秦龙人工智能技术在企业端有着很大的应用空间,由AI 加持的智能写作批改、智能对话、口语测评等解决方案,可以大大提高教育企业经营效率,突破现阶段低人效瓶颈,未来会有很大的市场

在线教育市场近年备受资本关注,成为又一全球经济增长点。

据艾媒网《2019—2020年中国在线教育行业发展研究报告》统计:2018年中国在线教育用户规模增长率为37.7%,2019年增长率为25.5%,预计2020年中国在线教育用户规模增长率为18.4%。

对在线教育而言,英语口语测评是该领域内探索已久的话题。以往的英语口试评委多为真人,一个老师要在短时间内测听大量学生,往往易受客观环境影响,以致结果的准确性、公平性大打折扣。且放眼全国,合格的口语教师仍处在严重短缺状态,学生备考、训练效果很不理想。

人工智能在教育领域不断渗透,市场规模也在持续快速增长。

当前,先声智能主要面向B端用户,为教育企业提供系统化、定制化的PaaS云技术服务,并根据不同用户需求,定向开发收取年费,当前已与阿里巴巴、新东方、百度、松鼠A I、步步高等多个行业标杆客户达成长期深度合作。

北京先声智能科技有限公司(以下简称:先声智能)成立于2016年,是一家教育领域的人工智能技术服务商,借助独有的AI+语言研究优势,已经在外语口语训练领域探索了多年。

先声智能(singsound)以人工智能技术作为突破方向,瞄准B端,搭建人工智能驱动的K12教考练SaaS平台,为英语口语测试精准赋能,提供AI技术解决方案。

联合创始人兼CEO秦龙毕业于卡内基-梅隆大学,获得计算机博士学位,曾担任著名语言学习平台Duolingo资深科学家,负责多语种语音识别技术,在人工智能产业领域深耕15年。选择切入AI+教育赛道,既有自身专业优势的推动,也源于他对教育行业发展痛点的长期观察。

传统线上教育本质上属于劳动密集型行业,对于企业而言,师资及教研成本往往居高不下,平均每位员工带来的人效值甚至达不到互联网公司的半数,这就有很大的技术优化空间。

“人工智能技術在企业端有着很大的应用空间,由AI加持的智能写作批改、智能对话、口语测评等解决方案,可以大大提高教育企业经营效率,突破现阶段低人效瓶颈,未来会有很大的市场。”秦龙告诉创业邦。

先声智能现已基于语音识别、自然语言处理等核心技术,搭建起包括智能口语测评、智能写作批改、自适应学习、智能对话以及情感识别在内的综合AI技术解决方案。

其中智能写作批改技术在国内外均处于领先地位,自适应学习系统荣获2018年NAACL SLAM国际大赛英语组冠军。团队还在瞄准OCR(光学字符识别)领域,希望通过拍照来对学生手写的作业进行批改。

在口语测评业务上,先声智能现已搭建起成熟的跨平台、跨终端体系,可以从音素、重音、语调、断句和韵律等多个维度精准评测学生口语发音,实时纠错并提供包含发音准确度、完整度、流利度等多维度的反馈功能,帮助学生提升英语听说能力,高效应对听说考试。

智能写作批改系统主要面向K12领域内的初高中学生,主要提供打分和改错两大基本服务。该系统依照国内中高考英语考试评分标准,模拟真实考试环境,可同时从词汇、内容和可读性等多维度给出全面反馈,切实从细节上提升学生的英语写作能力。

经过两年实验迭代,先声智能批改系统逐步覆盖所有语法改错点,2019年正式上线语法批改功能,为自动批改分析维度加码。

作为以技术为核心的行业领军者,先声智能率先将Transformer框架运用到批改上。Transformer能够突破现有技术的天花板,在数据不多的情况下进行模型训练,既是一大亮点,也是业界一大难点,先声智能成为市面上少有支持该技术的公司。

自适应学习也是当前先声智能产品矩阵中的一大亮点。从最早的规则化自适应一直发展到基于人工智能的自适应,自适应学习现已在多个国家、不同年龄层得到应用,可涵盖从小初高甚至职业教育的几百个学科,提升成绩效果明显。

先声智能的自适应系统优于国内大多数企业,已率先步入核心深度阶段——其自主研发基于深度学习的 Encoder-Decoder模型——CLUF,包含语境编码器 Context Encoder、语言学特征编码器 Linguistic Encoder、用户信息编码器 User Encoder、题型信息编码器 Format Encoder四大部分。

先声智能就是通过解析由编码器输出的高维特征做出预测,在最短时间内,准确判断一个人在学习一段时间后对以往知识点的掌握程度。

目前,国内借助AI技术赋能企业的案例不在少数,要在激烈的市场竞争中打出差异点,单纯从底层算法开放度较高的AI软件技术本身来说尚且不够,对此先声智能选择将技术与行业深度融合。

“通用型语音识别多专注于将语音转化成文字,将口语自动修正成抹平方言口音、表意明确的书面语言。而对于K12教育,最后目的是判断学生的真实英语水平,需要识别出的文本能真实还原出学生的口语内容,保留其语音、语法错误。

先声智能在K12英语教育领域垂直深耕,对每一个具体教育场景深入调研,在技术、内容上进行有针对性的研发,打造整体化教育解决方案。”秦龙对创业邦介绍。

当前,先声智能主要面向B端用户,为教育企业提供系统化、定制化的PaaS云技术服务,并根据不同用户需求,定向开发收取年费,当前已与阿里巴巴、新东方、百度、松鼠AI、步步高等多个行业标杆客户达成长期深度合作。

2020年上半年,先声智能的产品复购率超90%,占据行业头部地位。未来公司将继续垂直深耕教育领域,采取矩阵化、系统化的产品战略,巩固行业地位的同时拓宽国内外用户市场。

作为一家AI赋能企业,先声智能核心技术成员多来自卡内基-梅隆大学(CMU)、中国科学技术大学等全球顶尖高校,并聘请卡内基-梅隆大学(CMU)计算机系教授、智能对话专家Alex Rudnicky担任首席科学家。

截至2020年7月,先声智能共有员工50余人,技术人员占比超70%。公司接下来将继续保持现有员工结构,扎实稳定增长,加大在人工智能细分领域的人才投入。

在融资方面,先声智能已连续完成三轮融资,现处于A轮阶段。历史投资方包括创世伙伴、好未来、浙大友创、联想之星等。未来公司将面向市场寻求Pre-B轮融资,用以更加细化打磨产品,拓展技术、商务团队,进一步开拓行业市场。

猜你喜欢

编码器口语人工智能
2019:人工智能
人工智能与就业
编码器反馈信号对变频调速系统地影响
数读人工智能
基于TMS320F28335的绝对式光电编码器驱动设计
下一幕,人工智能!
口语对对碰
口语对对碰
看影视学口语
练习口语的一些小提示