先声智能：用人工智能打通K12语音识别市场

2020-09-26牛妤坤

创业邦 2020年9期

牛妤坤

先声智能联合创始人兼CEO 秦龙人工智能技术在企业端有着很大的应用空间，由AI 加持的智能写作批改、智能对话、口语测评等解决方案，可以大大提高教育企业经营效率，突破现阶段低人效瓶颈，未来会有很大的市场

在线教育市场近年备受资本关注，成为又一全球经济增长点。

据艾媒网《2019—2020年中国在线教育行业发展研究报告》统计：2018年中国在线教育用户规模增长率为37.7%，2019年增长率为25.5%，预计2020年中国在线教育用户规模增长率为18.4%。

对在线教育而言，英语口语测评是该领域内探索已久的话题。以往的英语口试评委多为真人，一个老师要在短时间内测听大量学生，往往易受客观环境影响，以致结果的准确性、公平性大打折扣。且放眼全国，合格的口语教师仍处在严重短缺状态，学生备考、训练效果很不理想。

人工智能在教育领域不断渗透，市场规模也在持续快速增长。

当前，先声智能主要面向B端用户，为教育企业提供系统化、定制化的PaaS云技术服务，并根据不同用户需求，定向开发收取年费，当前已与阿里巴巴、新东方、百度、松鼠A I、步步高等多个行业标杆客户达成长期深度合作。

北京先声智能科技有限公司（以下简称：先声智能）成立于2016年，是一家教育领域的人工智能技术服务商，借助独有的AI+语言研究优势，已经在外语口语训练领域探索了多年。

先声智能（singsound）以人工智能技术作为突破方向，瞄准B端，搭建人工智能驱动的K12教考练SaaS平台，为英语口语测试精准赋能，提供AI技术解决方案。

联合创始人兼CEO秦龙毕业于卡内基-梅隆大学，获得计算机博士学位，曾担任著名语言学习平台Duolingo资深科学家，负责多语种语音识别技术，在人工智能产业领域深耕15年。选择切入AI+教育赛道，既有自身专业优势的推动，也源于他对教育行业发展痛点的长期观察。

传统线上教育本质上属于劳动密集型行业，对于企业而言，师资及教研成本往往居高不下，平均每位员工带来的人效值甚至达不到互联网公司的半数，这就有很大的技术优化空间。

“人工智能技術在企业端有着很大的应用空间，由AI加持的智能写作批改、智能对话、口语测评等解决方案，可以大大提高教育企业经营效率，突破现阶段低人效瓶颈，未来会有很大的市场。”秦龙告诉创业邦。

先声智能现已基于语音识别、自然语言处理等核心技术，搭建起包括智能口语测评、智能写作批改、自适应学习、智能对话以及情感识别在内的综合AI技术解决方案。

其中智能写作批改技术在国内外均处于领先地位，自适应学习系统荣获2018年NAACL SLAM国际大赛英语组冠军。团队还在瞄准OCR（光学字符识别）领域，希望通过拍照来对学生手写的作业进行批改。

在口语测评业务上，先声智能现已搭建起成熟的跨平台、跨终端体系，可以从音素、重音、语调、断句和韵律等多个维度精准评测学生口语发音，实时纠错并提供包含发音准确度、完整度、流利度等多维度的反馈功能，帮助学生提升英语听说能力，高效应对听说考试。

智能写作批改系统主要面向K12领域内的初高中学生，主要提供打分和改错两大基本服务。该系统依照国内中高考英语考试评分标准，模拟真实考试环境，可同时从词汇、内容和可读性等多维度给出全面反馈，切实从细节上提升学生的英语写作能力。

经过两年实验迭代，先声智能批改系统逐步覆盖所有语法改错点，2019年正式上线语法批改功能，为自动批改分析维度加码。

作为以技术为核心的行业领军者，先声智能率先将Transformer框架运用到批改上。Transformer能够突破现有技术的天花板，在数据不多的情况下进行模型训练，既是一大亮点，也是业界一大难点，先声智能成为市面上少有支持该技术的公司。

自适应学习也是当前先声智能产品矩阵中的一大亮点。从最早的规则化自适应一直发展到基于人工智能的自适应，自适应学习现已在多个国家、不同年龄层得到应用，可涵盖从小初高甚至职业教育的几百个学科，提升成绩效果明显。

先声智能的自适应系统优于国内大多数企业，已率先步入核心深度阶段——其自主研发基于深度学习的 Encoder-Decoder模型——CLUF，包含语境编码器 Context Encoder、语言学特征编码器 Linguistic Encoder、用户信息编码器 User Encoder、题型信息编码器 Format Encoder四大部分。

先声智能就是通过解析由编码器输出的高维特征做出预测，在最短时间内，准确判断一个人在学习一段时间后对以往知识点的掌握程度。

目前，国内借助AI技术赋能企业的案例不在少数，要在激烈的市场竞争中打出差异点，单纯从底层算法开放度较高的AI软件技术本身来说尚且不够，对此先声智能选择将技术与行业深度融合。

“通用型语音识别多专注于将语音转化成文字，将口语自动修正成抹平方言口音、表意明确的书面语言。而对于K12教育，最后目的是判断学生的真实英语水平，需要识别出的文本能真实还原出学生的口语内容，保留其语音、语法错误。

先声智能在K12英语教育领域垂直深耕，对每一个具体教育场景深入调研，在技术、内容上进行有针对性的研发，打造整体化教育解决方案。”秦龙对创业邦介绍。

当前，先声智能主要面向B端用户，为教育企业提供系统化、定制化的PaaS云技术服务，并根据不同用户需求，定向开发收取年费，当前已与阿里巴巴、新东方、百度、松鼠AI、步步高等多个行业标杆客户达成长期深度合作。

2020年上半年，先声智能的产品复购率超90%，占据行业头部地位。未来公司将继续垂直深耕教育领域，采取矩阵化、系统化的产品战略，巩固行业地位的同时拓宽国内外用户市场。

作为一家AI赋能企业，先声智能核心技术成员多来自卡内基-梅隆大学（CMU）、中国科学技术大学等全球顶尖高校，并聘请卡内基-梅隆大学（CMU）计算机系教授、智能对话专家Alex Rudnicky担任首席科学家。

截至2020年7月，先声智能共有员工50余人，技术人员占比超70%。公司接下来将继续保持现有员工结构，扎实稳定增长，加大在人工智能细分领域的人才投入。

在融资方面，先声智能已连续完成三轮融资，现处于A轮阶段。历史投资方包括创世伙伴、好未来、浙大友创、联想之星等。未来公司将面向市场寻求Pre-B轮融资，用以更加细化打磨产品，拓展技术、商务团队，进一步开拓行业市场。

猜你喜欢

基于TMS320F28335的绝对式光电编码器驱动设计

先声智能：用人工智能打通K12语音识别市场

猜你喜欢

杂志排行

创业邦的其它文章