APP下载

声纹技术的介绍、应用及个人隐私保护

2023-08-29陈美华

科技创新与应用 2023年22期
关键词:声纹识别声纹个人信息

汪 露,陈美华

(东南大学,南京 211189)

随着信息技术的飞速发展,个人生物信息被越来越多地运用在日常生活、财政金融、公共安全中。生物信息包括指纹、面容、虹膜和声纹等,这些个人生物特征是独一无二的,承载了许多个人信息与个人隐私。作为生物信息的一种,语言信息已被广泛应用于数字化时代,针对人类语言所表现出的可识别特征,可以对个体声纹进行身份识别认证和对群体声纹进行方言识别鉴定。声纹是一种独特且易于访问的生物特征,无须说话人的同意就可以从远程收集,且只需一个麦克风或一部手机或电脑就可以收集声纹。声纹具有普遍性、特定性、相对稳定性和不易复制性,是个体生物独一无二的语言生物信息,也是语言生物信息的重要内容。

1 声纹的概念及应用

1.1 声纹的相关概念

声纹是对语音中所蕴含的、能表征和标识说话人的语音特征,以及基于这些特征参数所建立的语音模型的总称[1]。声纹具有普遍性,可广泛应用于身份认证等领域。由于每个人说话时的短时频谱、韵律及语言学特征均有所差异,因此每个人的声纹都是唯一而独特的。即使有些人可以模仿他人说话,但是他们无法模仿说话人声音中最本质的特性,在声纹特征分析中仍会有所差异,因此声纹是无法复制的。成年以后,人的发音习惯趋于稳定,人的声纹特征在长时间内保持稳定不变,因此声纹具有相对稳定性。

1.2 声纹识别技术

声纹识别,又称为说话人识别,是指根据待识别语音的声纹特征识别该段语音所对应的说话人的过程,是一种通过对声音的光谱检查来识别人的方法[1-2]。声纹识别使用人们话语中的独特特征,声纹的独特性是由声腔和发音器官所决定的。就算声音被模仿、扭曲或掩蔽,也改变不了说话者的声道特征与发音特征,世界上任何两个人的声纹图谱都不一样,因此也就不会破坏声纹识别[2-3]。

按照实际应用的范畴,声纹识别可以分为声纹辨认和声纹确认两类。声纹辨认是指判断一条语音属于模型库中的哪一个人的过程,而声纹确认是指确认一条语音是否来自其所宣称的说话人的过程[3]。声纹辨认技术常常被广泛应用于公安司法和军事领域,而声纹确认技术的应用更加贴近广大群众的实际生活,目前已被广泛应用于金融和声纹锁控等领域。

1.2.1 声纹辨认技术的应用

1)声纹辨认技术已广泛应用于公安技侦领域,帮助公安与司法人员解决众多事务。如,厦门公安局指挥中心与厦门天聪智能软件有限公司合作,搭建了报警声纹采集与辅警系统;北京得意音通技术有限责任公司(以下简称北京得意公司)与深圳市中大信通科技有限公司合作,将声纹识别技术应用于社区矫正项目[3]。声纹识别技术在公安司法领域具体的实际应用表现在智慧警务建设、构建重点人员声纹库、日常治安防控、电诈打击和案件侦破等方面[4-5]。

将声纹识别技术融入警务部门的人口信息采集与案件办理过程,可以提高基层民警的工作效率、节省警力资源,同时将社区人口的声纹信息纳入社区声纹数据库,完善智慧警务语音云平台的建设。

采集如涉恐、涉毒等重点人员的声纹信息,构建重点人员声纹库,通过对比数据,公安部门可以有效遏制和打击涉恐、涉毒人员,维护社会长治久安。建立海量声音数据库,通过对比声音数据库和犯罪现场捕捉到的声音来识别嫌疑犯,锁定嫌犯的定位。

将声纹识别技术与打击电话诈骗相结合,采集诈骗分子的语音,提取其声纹特征,通过声纹对比可以快速识别诈骗信息,对广大民众预警诈骗信息,并快速锁定诈骗分子身份[6]。在侦查案件时,可以利用声纹识别技术对犯罪嫌疑人的语音信息提取声纹特征,推断其性别、年龄、身高、体态、文化水平和出生地等信息,刻画嫌疑人外在特征与心理特征,提供破案线索,缩小搜捕范围。对刑满释放人员或在逃人员运用声纹识别技术进行监听,能够阻止其再次犯案或快速有效实施逮捕[7]。

2)声纹辨认技术在军事领域有着重要的应用价值,目前已在军事保密、指令确认、情报侦听等方面得以应用[8]。

在军事系统应用声纹辨认技术进行身份验证,可以防止非法用户进入系统,也可以实现对军用计算机进行加密,保护机密文件不被窃取、篡改、破坏等。将声纹辨认技术应用至军事要地或军事禁地的门禁系统中,进行声纹身份认证,可以有效识别合法与非法出入者。

语音指令是军事行动中较为常用的信息传递方式,应用声纹辨认技术对命令发出者进行身份确认,可以避免敌军伪装我方指挥者发出假命令的情况出现。

军事活动非常重视情报,将声纹识别技术应用至电子监听系统,当截获到敌方的语音通话后,就可以准确识别出通话者的身份,尤其是高层领导者的身份,从而掌握大量的绝密情报,并判断情报的价值。

1.2.2 声纹确认技术的应用

2004 年,美国Beep Card 公司发明了声纹识别信用卡;2006 年,荷兰银行(ABN AMRO)使用美国Voice Vault 声纹识别系统,实现了用户身份认证;2008 年,Voice Commerce Group 推出了基于声纹识别的Voice Pay 服务;2011 年,中国建设银行与北京得意公司合作开发了声纹电话银行系统;2016 年,中国建设银行通过声纹认证技术对手机用户身份进行认证;2019 年,平安科技、金融壹账通与广发银行签署了声纹核身项目[3];2022 年,中国建设银行与北京得意公司合作建立金融科技“声纹+”联合创新中心。由此可见,声纹确认技术在金融领域的应用十分广泛,目前主要包括移动金融业务、电话银行业务、雇员管理业务[9]。

在网银账户登录、网络支付、线上转账和信用卡还款等方面,尤其是在征信机构[10],声纹可以被当作登录凭证来核验身份,可以有效提高资金交易的安全性与客户身份的验证速度。在远程开户和核保核赔等业务中,声纹确认技术可以辅助人工核实用户身份,提高工作效率,而线上业务中的语音资料也会被存档作为依据,便于未来追踪。

作为金融行业的一项重要业务,电话银行业务所有的操作都需要通过语音交互完成,因此声纹识别技术在电话银行业务中具有非常广泛的应用和非常重要的作用。当来电客户开通了声纹识别业务后,就可以直接通过声纹识别系统进行身份核实,节省大量时间。

将声纹识别系统与门禁系统相结合,声纹识别门禁系统可应用于银行等高度戒备的场所,尤其是保障加钞间出入口的门禁安全[11],实现进出权限管理、实时监控、异常报警等功能。

2 声纹泄露个人隐私——案例分析

声纹识别技术的普遍应用给人们的生活带来了极大的便利,但由于声纹承载着人们独特的生物信息,声纹信息一旦被泄露,基于生理特征的身份识别系统将会彻底崩溃[12]。随着越来越多的语音助手的出现,保护声纹一类的生物识别码变得越来越重要。

2019 年,亚马逊旗下的语音助手Alexa 和智能音箱Echo Dot Kids 被控诉在未经儿童或其父母同意的情况下,对数百万名儿童进行录音并收集声纹信息,收集儿童观看与收听的习惯,即使用户删除了设备上的语音记录,亚马逊仍保留了这些个人信息。此外,亚马逊拥有数千名负责审核语音对话的员工,将对话进行转录并发送给公司内相关的团队以便于更好地理解人类语言,但亚马逊在此之前从未对外公开过这一团队的存在,也没有对广大用户说明Alexa 语音技术背后有人工的介入。语音助手和智能音箱已经深入人们生活的方方面面,诸如此类的声控语音设备通过声纹识别、语音识别等技术与用户进行互动,逐渐对用户的数据提出了越来越多的要求。声纹信息中含有大量个人隐私,如用户的性别、年龄、个人爱好、家庭成员与家庭地址等敏感信息,不论是将用户的声纹信息运用于提高声纹识别功能以便于提高用户体验,抑或是将用户声纹信息转卖给第三方企业以便于从中牟利,都触犯到了广大用户的隐私保护权利。

“滴滴出行”App 在乘客使用顺风车服务时频繁索取用户手机的电话权限,自2021 年9 月起,在网约车业务中试运营全程录音功能,用户在使用该软件时必须授权录音功能,否则将无法使用滴滴出行服务。启动录音功能后,可以通过一定长度的语音识别出乘客的声纹信息,进而泄露用户的个人隐私与敏感信息,与个人相关的大量深层信息将会面临曝光的风险。声纹信息一旦被泄露,所有与生物信息认证相关的活动都会受到影响,如出入门禁、工作考勤、支付验证和行踪记录等,将严重影响公民的日常生活。滴滴公司违法处理647 亿余条个人信息,其中包含人脸识别信息、声纹信息、精准位置信息等敏感信息,严重违反了《中华人民共和国网络安全法》《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》。

众多互联网企业的类似案例表明用户的声纹数据面临泄露、买卖与曝光的风险,随之而来的是用户个人信息与个人隐私的泄露。生物信息的应用与发展给个人隐私与国家安全带来了新的挑战,保障生物信息安全是各国目前发展所面临的重点。

3 对策分析

大数据和人工智能技术的广泛应用和快速发展使得声纹信息以各种方式被泄露,不法分子和不良企业利用声纹识别技术的漏洞钻空子,侵害人身安全、财产安全、个人隐私,个人生物信息保护问题亟待解决。可以从建立健全相关法律法规、规范行业标准、处理整顿相关企业和平台,以及提高个人信息安全意识与能力4 个方面来应对。

3.1 法律法规

声纹识别技术是近几十年新兴的生物特征识别技术,部分国家已有保护公民声纹数据的相关条例,我国正处于声纹识别技术应用的上升期,利用声纹数据泄露个人隐私的案例时有发生,国家应从法律法规层面予以规范。目前我国越来越重对视语言生物信息的保护,逐步出台了相关的法律法规,如2020 年在《中华人民共和国民法典》中明确了自然人声音等生物信息的保护,进一步规范了个人生物信息的采集、存储、使用和加工等方面的要求。完善生物信息安全法治建设需从立法、执法、司法3 个方面共同推进,对违法违规的服务提供商与个人进行处罚、教育与管理,净化生物信息识别技术行业环境,为个人生物信息安全保驾护航。

3.2 行业标准

声纹识别技术广泛应用于金融和公安等行业领域,各行各业可以针对声纹技术在行业的发展情况推行各自的行业标准,一方面有利于声纹技术的应用与发展,另一方面也有助于行业未来的发展进步。比如,2019 年,中国标准化研究院联手声纹识别技术研发公司在福建厦门建立了我国首个声纹识别技术标准化研究基地,推动了多行业制定声纹识别技术的应用标准。金融和公安领域已经推行了声纹识别技术的应用标准与规范,中国人民银行于2018 年发布了声纹识别技术的金融行业标准,即JR/T 0164—2018《移动金融基于声纹识别的安全应用技术规范》,并将此规范下发给全国各大银行和金融机构,对声纹识别技术在金融行业的功能、性能、安全等方面做出了严格的要求[13]。

3.3 企业层面

企业应当遵守语言生物信息相关的法律法规和认真执行行业的相关标准,明确声纹识别技术的应用范围,不强制要求用户授权,杜绝过度采集用户个人信息;在储存和上传用户的语音文件前,应询问使用者是否同意,并向用户明确说明所需信息内容、语音数据用途、文件保存时间等重要信息;杜绝传送用户的全部录音,必要情况下只选取用户部分特定的语音传输至云端,所有和用户本人个人信息相关的信息应保存在用户的本地设备上,以避免用户个人声纹的要素被泄露[14]。此外,服务提供商或运用声纹识别技术的企业应提高身份认证系统的多样性,为用户提供多种登录方式。

3.4 个人防范

声纹是个人生物特征之一,承载了个人身份信息与众多个人隐私,但仍有许多人对声纹识别技术的概念的应用缺乏认知与了解,因此要尽快向公众普及语言生物信息安全知识,提高人们对声纹的认识,了解声纹所包含的个人信息及声纹识别技术的应用情况,加强每一个人对个人声纹信息保护的重视,不轻易允许应用程序授权使用和收集设备与数据中的个人生物信息;在使用声纹密码登录账号或认证身份时,选择较为私密的地点,避开其他人在场;不随意将自己特定的录音文件发送给他人,尤其是清晰地朗读数字、字母表,以免被有心之人剪辑和拼接用于电话诈骗或身份认证;仔细阅读应用程序中与个人信息相关的使用条例,主动了解国家地方的个人信息相关政策和维权的有效途径。

4 结束语

声纹是语言生物信息的重要内容,声纹识别技术已被广泛应用于公安、军事、金融等领域,应用前景广阔,受到高度重视。声纹承载了众多个人隐私与敏感信息,但仍有许多人缺乏对语言生物信息的认知与自我保护意识,同意或在不知情的情况下允许部分不良企业与平台不断要求自己提供个人生物信息。不法分子通过收集声纹数据窃取、泄露或买卖公民个人信息,严重威胁公民的人身财产安全。语音输入、语音助手等与个人语音相关的功能使得用户声纹信息被迫暴露给企业商家或应用程序,由声纹识别而带来的个人信息泄露也导致个人原始生物特征的泄露,严重侵犯个人隐私与人身安全,因此保护个体和群体声纹信息是保护语言生物信息安全和我国语言生物信息安全体系建构的重中之重。

猜你喜欢

声纹识别声纹个人信息
如何保护劳动者的个人信息?
个人信息保护进入“法时代”
警惕个人信息泄露
屏幕即指纹识别
声纹识别中的区分性训练
声纹识别技术的发展及应用策略
面向移动终端的语音签到系统
基于数字水印的人脸与声纹融合识别算法
个人信息保护等6项通信行业标准征求意见
声纹