声纹在综合领域的应用研究
2020-05-25杨先霞叶利莹张兰玉刘小艳石夷婷彭锦
杨先霞 叶利莹 张兰玉 刘小艳 石夷婷 彭锦
随着移动互联网的不断普及和发展,网络信息安全以及相关的身份认证逐渐成为了各界关注焦点。身份认证安全性的缺失会给移动互联网上的个人、企业和组织带来各类风险和损失。无论是个人还是企业组织,作为互联网基础设施和重要入口,身份认证技术提升和服务完善的需求都越发强烈,目前的移动互联网生态需要更加专业的网络身份认证方式和方法。人们对身份认证的要求越来越高,生物认证技术出现在了人们的视野中,一种基于人的生理和行为特征进行身份认证的方式。其中,声纹识别技术因其高安全、弱隐私、低成本的特性成为了一大发展趋势。
一、网络信息安全现状
随着我国经济的不断发展、人们生活水平的不断提高,人们的消费观念和消费水平也有了很大的转变与提升。据《2018年网络身份认证信息安全行业市场现状与发展前景》数据显示,中国网络身份认证信息安全行业市场规模稳步扩容,至2018年,中国行业市场规模达到132亿元,预计在2022年將增长到300亿元,其增速极快,市场前景巨大。
在这个契机下,身份认证信息安全行业也得到了快速发展。2017年我国网络身份认证信息安全规模达到了112.1亿元,在信息安全市场规模中占比超过18%。虽然网民数量快速增长、用户规模日趋庞大,但网民的身份信息安全却没有得到保护。
网络应用日益多样化,推动了我国互联网市场高速发展,但同时网络安全问题日益严重,网络身份认证行业迅速发展成为必然趋势。移动互联网服务场景不断丰富,应用场景日趋复杂,网络身份认证作为防护网络资产的第一道关口,在万物联网时代有着举足轻重的作用。
为解决新形势下的网络安全问题,防止和控制该类问题繁衍,身份认证成为了关键,远程身份认证是解决网络安全问题的关键手段。身份认证技术是能够对信息的收发方进行真实身份鉴别的技术,是保护信息安全的第一道大门,网上身份认证可有效识别、认证网络信息系统中用户身份的合法性、真实性和抗抵赖性。身份认证技术是证实被认证对象是否属实或是否有效的技术手段,其基本思想是通过验证被认证对象的属性来达到被认证对象是否真实有效。
二、身份认证方式的多样
近年来身份认证方式的不断发展,把身份认证应用在各个商业层面中变成了行业发展趋势。传统身份认证方式如暗号、口令暗号、密码、口令、IC卡、U盾等认证方式快速便捷、发展迅速。生物识别技术主要包括行为特征识别和生理特征识别。行为特征包括声纹识别、签名、步态/手势、键盘敲击,生理特征又包括指纹识别、面部识别、掌纹识别、虹膜识别和DNA识别。这些识别技术最大的优势就是认证自己就是自己。人的生理特征都存在唯一性,每个人都有独一无二的脸、指纹、虹膜等。由于每个人的生物特征具有与其他人不同的唯一性和在一定时期内不变的稳定性,所以利用生物识别技术进行身份认定相对其他身份认证技术是安全且准确的。但也正是由于生理特征的不可撤销性,生物特征信息一旦被泄露、大量的带有唯一性的生物特征数据被盗取,基于生理特征的身份认证系统将彻底崩溃。这也是生理特征识别方式的真正“痛点”。
正因为如此,这些具有静态属性的生物特征识别技术在技术突飞猛进的当今已显得不再那么可靠,随时有被攻破的可能,并且静态的生理特征是被动的,无法反映用户主观意识,而动态的生物特征识别技术正是在用户的主观意识下产生的、独一无二的身份密码。从生物识别技术的发展史来看,活体判断一直是生物识别技术的研发关键。由此可见,生物识别技术正由静态的生理特征识别转向以动态的行为特征识别为主的多元识别技术。
以下将着重介绍几种典型的生物识别技术:
(一)声纹识别
声纹是对语音中所蕴含的、能表征和标识说话人的语音特征,以及基于这些特征(参数)所建立的语音模型的总称。其具有交互性,弱隐私性等特点。在认证身份的同时,不涉及生理隐私泄露,在源头上可防民族生物特征信息泄露。声纹识别具有三大优势:应用起来性能最好、低成本防攻击、一句话解决所有问题。每个人在说话过程中所蕴含的语音特征和发音习惯几乎是独一无二的,即使是模仿,也难以改变说话者最本质的发音特性和声道特征。
(二)虹膜识别
虹膜识别通过一种近似红外线的光线对虹膜图案进行扫描成像,并通过图案象素位的异或操作来判定相似程度。虹膜识别过程首先需要把虹膜从眼睛图像中分离出来,再进行特征分析。虹膜具有高度独特性、稳定性及不可更改的特点,可用作身份认证的物质基础。但是虹膜识别技术成本高,而且不能防高清图片攻击。
(三)人脸识别
人脸识别是基于人的脸部特征信息进行身份认证的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行身份认证,通常也叫做人像识别、面部识别。尽管人脸比对的精确度很高,但对周围的光线环境敏感,可能影响识别的准确性。同时也受人体面部的头发、饰物等遮挡物影响,需要进行人工智能补偿。
(四)指纹识别
指纹识别即指通过比较不同指纹的细节特征点来进行识别。指纹识别技术涉及图像处理、模式识别、计算机视觉、数学形态学、小波分析等众多学科技术。由于每个人的指纹不同,就是同一人的十指之间,指纹也有明显区别,因此指纹可用于身份认证。但由于每次捺印的方位不完全一样,着力点不同会带来不同程度的变形,又存在大量模糊指纹,如何正确提取特征和实现正确匹配,是指纹识别技术的关键。
三、声纹识别技术
声纹,是对语音中所蕴含的、能表征和标识说话人的语音特征,以及基于这些特征(参数)所建立的语音模型的总称,而声纹识别是根据待识别语音的声纹特征识别该段语音所对应的说话人的过程。声纹是一种动态的行为特征,由于每个人在讲话时使用的发声器官如舌头、牙齿、口腔、声带、肺、鼻腔等在尺寸和形态方面有所差异,以及年龄、性格、语言习惯等多种原因,加之发音容量大小和发音频率不同,在发音时千姿百态,因而导致这些器官发出的声音必然有着各自的特点。可以说任何2个人的声纹图谱都不尽相同。由于声音的特殊性,声纹识别与其他行为特征相比,又兼具生理特性。
声纹识别技术又称说话人识别技术,就是基于这些信息来探索人类身份的一种生物识别技术。这种技术基于语音中所包含的说话人特有的个性信息,利用计算机以及现在的信息识别技术,自动地鉴别当前语音对应的说话人身份。声纹识别与语音识别不同,声纹识别的过程是试图找到区别每个人的个性特征,而语音识别则是侧重于对话者所表述的内容进行区分。在实际应用中往往把语音识别技术和声纹识别技术结合起来应用,以提高声纹身份认证系统的安全性能。
目前来看,声纹识别技术在各种生物特征里是相对比较安全的,可广泛应用于金融、交通、医疗、教育、旅游、司法等公共服务领域的认证服务工作。为百姓带来更多便利生活的同时,又保障了个人的信息安全。
随着声纹识别技术的逐步完善,其更大的应用前景在于安防领域,比如刑侦破案、门禁、银行交易、机器人、智能家居产品、无人车等。随着平安城市建设的推进,为弥补视频监控的不足,声纹识别技术在城市安防系统中的应用也逐渐得到重视。在未来其应用领域也会更加广泛。
四、多领域应用研究
(一)在教育方面:
“罗彩霞”事件让大家认识到信息泄露、学籍认证失误的严重后果。在学生入学进行学籍认证时,学校管理层为了确保学生学籍的准确性,需要学生开具多处身份证明并加印盖章,这不仅增加了繁琐的收集纸质文档工作量,还有可能造成信息被中途盗取。一旦录取信息被截取,替读事件就有可能出现,学籍认证的准确率会随之降低。
很多高校现在采取智能的身份认证方式进行上课的考勤打卡、图书馆的进出身份认证等、这样的方式给同学们带来了方便的同时也出现了一些新的问题。由于指纹以及人脸的采集设备较为昂贵,所以一个教室一般配备一台采集器,这就导致上课前学生排长队进行打卡认证,耽误了上课时间,影响了教学质量。指纹和人脸的破解门槛较低,还是没有办法杜绝学生逃课、替课的问题。
随着我国教学改革的不断推进,各种类型的招生规模和数量逐年扩大,参加各种考试的考生人数也在逐年递增,各高等院校和教育考试机构采取了种种措施进行防范,但还是很难避免代考现象的发生。从目前的情况来看,大多数考场考生身份的核验还是采用身份证、准考证等认证物品,在考场入场前依靠监考老师进行人工比对认证方式,由于人工认证具有主观性,认证标准存在不一致的情况,很大程度上导致认证结果难以把控。
因此学校在对考生身份核验的过程中,可引入多样化智能识别比对系统,减少人工成本,提高辨识率。结合声纹识别技术可以有效防止学生逃课,替课的现象、解决老师耗时长,耽误上课时间的问题。且声纹采集设备成本极低,可以减轻学校部分支出。
(二)在社保领域:
随着养老保险覆盖面越来越广,养老金社会化发放程度的不断提高,随之带来的养老金发放管理工作难度也越来越大,不同地区都有不同程度的虚报冒领现象。由于目前全国各地对退休领取补助的人员生存状况的稽核工作力量非常薄弱,多数地区没有有效的制约手段,导致虚报冒领养老金的现象时有发生,特别是贫穷落后的地区,养老金流失问题显得尤为严重。
城乡养老保险是社会保障体系的重要组成部分,目前我国社保主要面临三个问题:加速进入老龄化社会,社保金管理存在冒领问题,现有解决冒领问题的方法存在成本高、效率低等问题。
声纹识别技术可以有效解决参保人员的远程和现场的身份认证问题,因其远程无监督的特性可以避免指纹和人脸等需现场办理、不易采集、易伪造等天然缺陷,隔绝了身份造假的可能性,声纹采集设备的便捷可以节省大量成本,同时可以有效杜绝养老金流失的问题,方便老年人足不出户安全快捷领取养老金。以往半年甚至一年一次的认证,可以提高为每月一次;以往的参保用户抽查方式,可以变为全面普查,为社保机构免去诸多的人力成本、物力成本、行政成本和时间成本。通过数字化、智能化的结合声纹识别技术的社保认证系统,能够有效解决参保人员远程生存认证的难题,并且能为社保机构建立一套更经济,更便利,适用范围更广的生存认证方式。
(三)在安防领域:
随着科技的发展,不同的犯罪手段也变得多种多样,治安需求不断增加。传统的人工监控方式,智能化程度低,无法实现大规模视频监控环境下的事前感知、事中联动、事后有效处理及智能检索。急需人工智能以及新的身份认证技术在视频监控中提供有效的技术支撑。
而声纹识别技术具有简便、准确、经济及扩展性良好等众多优势,因其对用户干涉较少,所以用户更易接受目前正广泛应用于安全认证、控制等诸多领域,特别是基于电信网络的身份认证。基于以上优势,声纹识别技术比较适合在大范围的安防场景下使用。
声纹识别技术还可以用于防止电信诈骗。如今,各地公安部门都有个人信息采集系统,公安系统可以建声纹数据库,用于电信诈骗中电话声音识别,通过该识别技术找到嫌疑人。
如今的安全部门也在更多地引入这一技术进行犯罪活动的打击,例如,在车站、飞机、码头等公共安检点和关键卡口,通过声纹对乘客进行身份认证,可以有效对不法分子进行甄别和提示警报,通过通讯跟踪和声纹识别技术对罪犯进行预防和侦查追捕。助力公安有效遏制与打击犯罪,构建和强化安全的社会公众环境。
通过对说话者语音和数据库中登记的声纹比对,对用户进行身份校验和识别,从而确定说话人的身份信息。针对电话勒索、诈骗等事件,研发了电话反欺诈系统,为公安司法人员提供声纹识别技术,从通话语音中锁定嫌疑犯人、减小刑侦范围。
(四)在其他领域:
因为声纹识别技术具有经济性、可操作性等优势,在将来会在更多的领域中获得更为广泛的应用。如在青少年防沉迷系統身份认证、医疗安全认证和安全支付等方面应用,既减少了冒用身份证登录的问题,又保障了用户的账户及资金安全。
1.青少年防沉迷系统
据中消协发布《青少年近视现状与网游消费体验报告》显示,青少年初次接触电子设备和网络游戏均呈现低龄化趋势,超三成被访者有网游充值消费的经历。《报告》表明,三分之一强制实名游戏未启用防沉迷时长提醒及强制退出机制,强制实名游戏不足四成,防沉迷机制在平台管理层面还存在明显缺陷。
进入“青少年模式”后,用户使用时段、服务功能、在线时长都会受到限制,只能访问专属的内容池。例如,每天使用时间不能超过40分钟;晚上10点开始到早上6点之前都无法使用;无法开启直播与同城浏览页面;无法进行充值、提现、打赏等一系列操作。
对于推出的“青少年防沉迷系统”,一些网友表示作用不大。首先一点是系统仍然存在bug。有的App卸载后重新安装,就可以恢复正常模式使用,也会不再出现弹窗提示是否进入“青少年模式”。国家网信办的相关负责人指出,当前短视频青少年防沉迷系统尚依赖家长自主选择,未成年子女仍有机会选择不开启“青少年模式”,绕过防沉迷系统随意浏览。且也有家长反映,现在的孩子都很聪明,能猜到或者偷偷记下家长设置的密码,或冒用家长的身份证进行认证。相比于视频平台,网络游戏的“防沉迷模式”现状堪忧。
针对以上情况特点,提出青少年防沉迷系统解决方案。在注册、登录、支付等环节,声纹识别技术的加入可以杜绝冒用身份证登錄、密码被窃取后认证成功等情况。而对于游戏类网站,声纹识别技术能够获取游戏语音对话中的声纹信息,准确判断使用者的身份,自动开启“青少年模式”,实现全流程认证。
2.医疗安全认证解决方案
在医疗问题多样化且频发的今天,非法挂号、医保冒用、重要的医疗器械失误操作等问题时有发生。声纹识别技术将为多种医疗场景提供安全解决方案。使用声纹预约挂号可制约号贩非法挂号;通过声纹识别可防止医保冒用;以声音作为身份信息将可实现挂号、住院、缴费流程一体化;利用声纹识别技术为重要的医疗器械加上权限,避免失误操作;使用声纹识别技术将实现跨省共诊及跨省支付;准确识别病人情绪及声音病灶,以此来实现望闻问切等功能来尽可能减少医疗问题的发生。
在医疗健康领域,可采用“智能识别+人工审核”的模式,精准敏捷地解决传统图片转文字的录入难题,实现医疗及体检单据智能录入,结合全球领先识别技术与趣味简易的操作,既解放了医疗人员的双眼和双手,又能为社会空闲劳动力创造福利,轻松无忧地满足单据或报告的数字化需求,实现双赢。
3.安全生活支付
据2018年中国互联网支付用户调研报告显示,网上支付、手机支付、第三方支付已成为现代人购物付款的主流方式。显然,网络支付的安全性应当被重视起来,网络支付的身份认证也愈发重要。近年来,有相关媒体接二连三地报道支付宝被盗刷、网银被转出等案件。
为了防止这类案件的再次发生,将声纹识别技术加入到交易支付中,能有效提高个人资金和交易支付的安全性。也许有一天,当你通过支付宝向卖家付账时,仅需拿起手机打开支付宝说句话就可以免去输入繁琐的支付密码,可体验到声纹识别技术带来的全新安全支付便利性。(作者单位:贵州师范大学经济与管理学院)
2019年贵州师范大学大学生创新创业训练项目成果 项目编号:201910663020X