APP下载

面向电力调度的语音识别关键技术研究

2021-03-07朱明增岑建军覃秋勤陈极万

电子技术与软件工程 2021年19期
关键词:音频语音调度

朱明增 岑建军 覃秋勤 陈极万

(广西电网有限责任公司贺州供电局 广西壮族自治区贺州市 542800)

电力调度是电力服务过程中极为重要组成部分,工作负荷大,需要有强大的信息处理能力,传统的电力调度技术无法满足电力需求。语音识别关键技术,作为声纹识别的生物技术的一种,可以实现不同环境不同识别,对人的声音进行识别以此确认身份信息,进而保证电力调度的安全性以及有效性。

1 技术分析

语音识别技术的主要内容涵盖四部分,如图1所示。

图1:语音识别流程

1.1 数据采集以及预处理

该环节的主要内容是通过对文本数据以及录音的内容进行处理并修正,进一步使文本和音频保持高度对应,而且将文本和音频进行序列标签,进而得到相对应的拼音序列,保证拼音序列有效性以及安全性。在此过程中通过对我们已经录音数据信号进行分帧操作,有效开展频谱分析降低高频保证数据的有效采集及处理[1]。

1.2 声学模型训练以及语言模型训练

语音识别技术重点在于对声音进行识别,所以在完成声音采集以及处理过程后,需要进一步实现对声音的有效分析。分析过程中需将声音进行分帧处理,将声音分成若干个小段,不同段的声音代表了不同的状态。不同的小段组成一个音素。单词的发音是因素的重要内容。通常情况下语音识别需要通过三种概率训练进行完成:

(1)观察概率。这一部分主要是指对每帧语音均需要对状态进行概率观察;

(2)转移概率。主要指的是每个状态自身概率或者下一个状态的概率[2]。

(3)语言概率。这一部分也是较为重点的一部分,主要指的是通过对语言状态的统计得出语句出现的概率规律。前两部分的获得主要是通过声学模型获得,后一部分是通过语言模型获得。

1.3 端点检测

端点检测这一部分的主要内容是对未进行语音识别的音频中存在的部分照明以及空白音部分音频进行去除,同时分析音频中的有效音频以及无效音频,将无效音频进行识别并且去除,进而保证语音识别有效性以及科学性。该技术在实现的过程中,主要使用隐马尔可夫算法,通过该算法可以保证语音段落的真实性。除此之外还涉及频谱分析,倒谱分析以及能量阈值研究。

1.4 语音识别

语音识别的主要作用是基于声学模型将未知的语音序列进行有效识别,从而将文中的内容通过文本的方法进行体现,以此让电力调度可以更好、更快、更加便捷地为企业进行服务。该部分技术主要依赖于语言模型以及声学模型训练,通过两种内容的训练进而实现端点检测,将声音进行文本转化[3]。

2 技术于电力调度应用探究

2.1 语音数据库生成

将电力系统所设计的命令进行录入后,通过控制系统生成语音关键文字,并且依据关键字的内容,实现语音关键词数据库的建立。数据库控制主机通过调度自动化主站系统实现有效的通信方式对其svg文件、g文件、cim文件、cime文件获取的信息及其他电力系统文件中的信息、关键字实施有效的语音技术识别,再利用人工建立的数据库实施不同配置,实现不同地区采集的电力术语进行关键字列表建立,进而保障语音数据库的完整性以及全面性[4]。该项技术中通常涵盖两部分内容:

(1)语法技术。该项技术作为语音识别技术的一种辅助性技术,对语音识别功能实现有着重要作用。语法文档编译后可以被网络识别,而且在语音识别器的作用下,可以对语法进行提取,提取后的语法与网络路径内容匹配,最后将用户的语音进行内容体现。简单讲语法技术是语音识别以及应用的关键内容,同时也是必要内容。

(2)语音数据库表示列。语音数据库表示列主要作用是对语音文件进行存放。

2.2 语音识别

语音识别过程较为复杂,需要通过对人员的语音数据进行录入,并且通过控制系统主机对语音录入进行采集。将采集后的语言进行解析,利用语法配置技术以及语音数据库表示列,进一步实现语音词库的检索,将采集的语音信息通过语音检索的方法,进而转换为文本信息,以此实现语音识别的作用。

2.3 解析自然语言

现阶段人类在进行交流的过程中,都是以真实情感以及事实基础进行感受感应交换。同理在进行语音识别过程中机器也需要对语言的自然感受进行识别,并且将其进行转化。通过对语言的最真实感受内容进行识别,进一步保证识别的准确性以及有效性[5]。而且电力调度系统是一个较为复杂的,极具专业性,综合性的系统。语音识别技术在电力调度过程中的应用需要加强对电力调度的专有名词以及细分实现进行研究。

2.4 结合互联网资源

语音识别技术的应用,是语音服务以及互联网资源两部分集成下才可以实现的。而且当前的网络基础设施对于区域的编程更加容易,更利于第三方应用程序的有效开发。VoiceXML 是 W3C 组织推荐的基于XML 的语音浏览协议,目的是介绍一种将电话和Web服务结合起来的有效方法。

2.5 语音传输

其他安全的语音传输方式可以通过将能源的语音录制后保存为WAV的文件而后再将此文件进行二进制编码转换,将转换后的文件进行数据库存储,需要使用文件的时候读取二进制编码,将其转换为服务器可以接受的语言表达形式上传客户端,为保证文件内容的安全性可以对文件实施加密处理,需要用到文件的情况下将文件进行解压。

2.6 软件控制

系统控制主机依据关键字搜索进行自动化电力调度图形界面控制,以此进一步保证电力调度过程中的智能性以及安全性[7]。

(1)操作命令可以通过语言生成进行命令指挥,通过智能解析实现动态预演,同时可以进行安全警告,通过语音控制界面实现语音检索。

(2)在设备以及模型的辅助下,通过语音控制对信息各个内容进行建模,进一步实现电力调度过程中图表语音转换一体化发展,进而通过多维度,多角度,高互动性的动态,实现有效的电力调度应用。

(3)改善传统的电力调度服务内容提高调度员的工作效率,并且使电力调度工作更加便捷操作。通过语音形式进行命令传输降低了手写输入的时间,使调度员可以更加安全的开展电力工作。

(4)发出语音者通过命令的下达,进行选择任务接受界面,并将下达命令音频内容保存到数据存储中,通过有效的安全协议进行封装,保证相关人员收到指令后,可以通过语音获得对方指令。命令接收后通过完成操作进一步录制语音文件,进行回复。

(5)语音识别可以将调度员的指令形成信息指令通过智能设备进行数据处理分析并且实现数据信息检索,有效的找出变电站以及线路的相关内容,通过对相关内容的操作可以进一步保障电力调度的安全性及有效性。

(6)调度员进行电力调度服务中相关会议指令下达等信息都可以使用语音识别技术,进行文本翻译后将其在计算机内进行备份存储。通过该种信息采集的方式,可以进一步提升信息质量,保证信息安全。

(7)电力调度需要保证安全,所以在电力调度中语音识别技术中的声纹识别技术可以实现电力调度系统的唤醒设置,该项设置具有一定的特殊性,一旦设置声纹解锁必须由特殊人员操作,才可以进行指令下达。通过设置声纹识别进行交接班,可以在一定程度上保证电力调度系统的安全性及可靠性,在一定程度上杜绝了系统密码丢失或者其他人操作造成电力调度系统服务偏差风险[8]。

(8)电力调度工作其中涵盖的信息量较大,操作内容较为复杂。例如预令回签,安全校核等功能。这些功能往往需要等待回执。通过语音识别技术,可以在回执的回复过程中进行语音提示。通过语音提示可以让调度员更加高效地进行回执处理,保证电力调度工作的高效性。

3 应用案例分析

音频语料共有 202 h,训练数据有160 h,测试数据有 42 h,对声音识别效果进行分析。

3.1 语音识别效果

基于 DNN 的语音识别效果如表1。

表1:训练结果

3.2 调度日志记录

语音识别技术需要基于语音识别系统利用区域内内网辅助,实现电力调度过程中的语言识别以及语音内容传达,进而完成电力调度工作部署以及工作内容反馈。选择100条正常进入的调度日志进行语音记录测试,通过将测试结果与键盘记录相比较发现,实施键盘记录所花费的时间1230s,实施语音进入花费的时间650s,两者相比,平均纪录差降低了47%以上。某厂站画面语音调阅共测试某区域电网厂站合计206 座,均采用语音调度广播战画面的方式实现了95%成功率,而且系统响应速度较快,可以在一定程度上满足电力调度服务过程中的使用需求。

4 总结

语音识别技术对电力调度服务效率以及服务质量的提升起到关键性作用。利用语音识别服务满足当前电力服务智能化需求,同时对电力调度中电力信息起到有效保密作用,减少人与人之间对话下达命令,降低电力调度工作中失误发生,以此进一步提升电力服务整体水平。总之,为了保障电力调度工作效率,需要进一步加强语音识别技术应用研究。

猜你喜欢

音频语音调度
《调度集中系统(CTC)/列车调度指挥系统(TDCS)维护手册》正式出版
一种基于负载均衡的Kubernetes调度改进算法
魔力语音
基于MATLAB的语音信号处理
虚拟机实时迁移调度算法
基于MQ3与MP3的价廉物美的酒驾语音提醒器
必须了解的音频基础知识 家庭影院入门攻略:音频认证与推荐标准篇
对方正在输入……
基于Daubechies(dbN)的飞行器音频特征提取
音频分析仪中低失真音频信号的发生方法