基于嵌入式音视频采集的视频会议处理系统
2024-12-17雷镕嘉王熙乾吕剑书樊明葆文涛
摘 要:目前,视频会议系统应用中还存在音视频数据采集质量不高等问题。因此,本文研究并设计了一款基于嵌入式音视频采集的视频会议处理系统,将S3C2410微控制器作为核心处理器,并选取合适的摄像头和麦克风传感器,通过模数转换器和数字信号处理单元对原始音、视频信号进行处理。同时,该系统设计了音视频传输质量(QoS)控制软件和视频内容加密软件等,利用优先级设置和带宽保障机制,保证音视频数据在网络拥塞过程中优先传输并获得固定份额的网络带宽。同时使用AES加密标准和数字签名技术保护数据的完整性和安全性。测试结果表明,该系统在视频和音频采集、编码质量方面均能达到预期目标,为用户提供流畅、稳定的视频会议体验。
关键词:嵌入式技术;音视频采集;视频会议;处理系统
中图分类号:TN 948" " " " " 文献标志码:A
随着全球信息化、数字化进程加速,视频会议系统已成为现代通信技术的重要组成部分,被广泛应用于远程教育、远程医疗和企业会议等多个领域[1-2]。嵌入式音视频采集技术是视频会议系统的基础技术之一,主要利用集成硬件和软件进行音、视频信号的采集、处理和传输。与传统的视频会议处理系统相比,嵌入式音视频采集技术具有实时性好、功耗低、成本低和体积小等特点,在便携式设备和移动终端中具有广泛应用。在视频会议系统中应用嵌入式音视频采集技术不仅提高了系统的实时性和稳定性,还降低了系统的功耗和成本,为视频会议的普及和发展提供了有力支持。因此,基于嵌入式音视频采集的视频会议处理系统设计具有重要的研究价值和实际应用意义,不仅能够提高视频会议系统的性能和可靠性,还能进一步推动视频会议技术发展,为人们的生活和工作带来更多便利。
1 系统硬件设计
基于嵌入式音视频采集的视频会议处理系统的硬件设计是一个复杂的重要过程,涉及多个组件的集成和优化,关系到系统高效运行和音视频采集质量。
本文基于ARM架构,将S3C2410嵌入式处理器作为嵌入式音视频采集的视频会议处理系统的大脑,以处理音视频数据、执行操作系统并运行各种应用程序。摄像头和麦克风主要采集原始音视频数据,配合模数转换器(ADC)和数字信号处理(DSP)单元,将原始信号转换为数字格式并进行必要的预处理。64Mbytes 8位的NAND闪存和64Mbytes 32位的SDRAM存储设备用于保存音、视频数据和系统运行所需的软件和配置文件。DC-DC电源转换器可稳定地对系统进行电力供应。
S3C2410是一款基于ARM920T内核的嵌入式微处理器,采用0.18μm工艺制造,具备32位ARM指令集。其内部主要包括独立的16kB指令、数据缓存以及256MB寻址空间。硬件特性包括多功能定时器、UART/I2C/SPI等接口、一个LCD控制器和触摸接口等。此外,S3C2410还集成了外部存储器控制器,支持SDRAM、NAND Flash等存储设备,为硬件设计提供高度集成的解决方案。为提升S3C2410微控制器的处理效率,对其固件进行深度优化,编写高效的底层驱动程序,减少中断响应时间和任务切换开销,同时采用实时操作系统(RTOS)策略,进行音、视频数据实时处理。
2 软件设计
系统软件部分采用自适应编码算法,该算法能够根据网络状况动态调整编码参数,优化音视频流的压缩比和传输速率,并根据网络带宽实时监测结果,自动调整视频编码的码率,保证在网络拥塞情况下降低码率,减少丢包,并在网络状况不佳情况下降低帧率,保证视频的流畅性。
2.1 控制音视频传输质量(QoS)软件设计
音、视频质量保证软件设计模块的核心职责是实时监控和管理音视频流的传输质量,在复杂多变的网络环境中,保障音、视频传输的优先级。为实现这一目标,该模块主要采用先进的机器学习算法,对网络拥塞进行预测和缓解。在此过程中,系统会对网络的历史数据进行全面收集,包括带宽使用情况、数据包传输延迟和丢包率等关键指标。
对这些数据进行预处理后,该模块能够提取出影响网络拥塞的关键特征,例如流量大小、流量模式和时间戳等,将这些特征作为训练模型的输入参数。在此基础上,还需要在模型的训练过程中应用监督学习方法。为了保证模型的准确性,主要采用k-fold交叉验证方法。该方法将数据集划分为k个大小相似、互斥的子集,在每次迭代过程中,将k-1个子集合并作为训练集,剩余的1个子集作为验证集。在训练过程中,模型会在训练集上学习网络拥塞的规律,并在验证集上评估其预测准确率。经过多次迭代,每次更换不同的验证集,最终可以得到k次验证的整体准确率,如公式(1)所示。
(1)
式中:Ac(Vi)为第i个折的验证集准确率;k为交叉验证的折数。
评估结果见表1。
表1 评估数据表
Fold Training Set Size/% Validation Set Size/% Accuracy(Train)/% Accuracy(Validation)/%
1 82 18 96.4 95.0
2 78 22 95.7 97.5
3 84 16 97.2 96.3
4 76 24 97.6 971
5 80 20 98.7 97.6
AVG - - 97.1 96.7
注:Fold为交叉验证的折数;Training Set Size为用于训练模型的数据集大小;Validation Set Size为用于验证模型的数据集大小;Accuracy(Train)为模型在训练集上的准确率。
表1分别进行了5-fold交叉验证。各fold的训练集大小为76%~84%,验证集大小相应为16%~24%。模型在训练集上的平均准确率为97.1%,在验证集上的平均准确率为96.7%。表明模型不仅具有良好的泛化能力,而且验证集的准确率普遍高于训练集,模型并没有明显的过拟合现象。
进而根据评估结果预测未来的网络拥塞情况,一旦预测到潜在的通信拥塞,系统将自动调整传输策略,例如降低数据传输速率、改变路由路径或优先级排序。在此基础上,系统采用ICMP探测技术发现所有可能的网络路径,对每条路径的带宽、延迟和丢包率等指标进行评估,确定路径质量,并采用最优化算法,选择多条质量较高的路径进行数据传输,具体计算如公式(2)所示。
(2)
式中:Fn为路径i的适应度值,用于选择最优路径;Bi 为路径i的带宽;Tb为所有路径的带宽总和; Ri为路径i的可靠性;Tr为所有路径的可靠性总和。
系统根据各路径质量,将数据包均匀分配到不同路径上。对于关键数据,系统会在多条路径上进行冗余传输,根据路径质量的变化动态调整数据分发策略。同时,系统还会监控每条路径上的数据传输,检测是否有丢包或错误发生。一旦检测到错误,系统将启动重传机制,优先在质量较好的路径上重传数据。最终利用QoS机制保证数据在每条路径上的传输质量。
该设计模块的优势在于能够根据实时网络状况调整音、视频流的传输策略,有效应对网络波动和拥塞问题。通过不断优化模型,该模块能够在保证音、视频传输质量的同时,提高网络资源的利用率,为用户提供更稳定、流畅的音视频体验。此外,随着网络环境不断变化,该模块还能自适应地调整预测模型,保证音、视频质量保证软件始终具备较高的实用性和可靠性。
2.2 视频内容加密软件设计
为了防止视频会议内容被非法录制或传播,本文在系统的软件模块中设计了视频内容加密部分,主要目的是保护会议内容不被非法截取、泄露和篡改。在进行音、视频数据传输之前,需要将AES(高级加密标准)设定为加密标准,并在嵌入式处理器内置加密和哈希计算单元,专门用于计算数据的哈希值和数字签名。这样,在数据传输之前,嵌入式系统就可以通过这个软件模块自动执行这些校验操作,保证数据的完整性。具体校验流程如图1所示。
发送方在嵌入式处理器中使用预先定义的哈希函数(SHA-256)计算即将传输的音、视频数据D的哈希值H(D),SHA-256是一种广泛认可的加密哈希算法,能够生成一个256位的固定长度哈希值H(D),该值被视为原始数据的唯一“指纹”。
为进一步保证数据来源可靠性和防篡改性,发送方将使用自己的私钥SK和哈希值H(D),并采用RSA数字签名算法生成数字签名S(D)。RSA算法是一种非对称加密技术,该算法允许使用私钥进行签名,而公钥用于验证签名。这样,发送方将原始数据D、哈希值H(D)和数字签名S(D)一同发送给接收方。接收方接收到这些信息后,会使用与发送方相同的SHA-256哈希函数对音视频数据D进行哈希值计算,得到H'(D)。这一步骤是为了验证数据在传输过程中是否完整。接收方需要利用发送方的公钥PK对数字签名S(D)进行验证。如果签名验证成功表明数据确实是由持有私钥的发送方发送的,并且在传输过程中没有被篡改。
接收方将计算出的哈希值H'(D)与发送方提供的哈希值H(D)进行比较。如果2个哈希值完全一致,说明数据在传输过程中保持了完整性;如果哈希值不一致,表明数据可能在传输过程中遭到篡改。最后,接收方根据数字签名验证结果和数据完整性校验结果,对所传输的数据进行最终决策和处理。如果哈希值匹配且签名有效,接收方可以认为该数据是完整且可信的,进而对数据进行进一步处理,例如解码播放。相反,如果哈希值不匹配或签名无效,接收方将拒绝接收数据,并采取必要措施通知发送方,以便进行其他安全处理。
上述流程能够促使基于嵌入式音、视频采集的视频会议处理系统在数据传输前和接收后自动执行数据的完整性校验,保证音、视频数据的完整性和安全性。这种方法适用于嵌入式环境,可减少外部依赖,并能在资源受限的设备上高效执行。最后使用SSL协议对音、视频数据传输进行加密保护,同时对视频会议内容进行实时监控,一旦发现异常情况,立即采取措施进行处理。以上措施可有效保障基于嵌入式音视频采集的视频会议内容的安全性,避免数据泄露、篡改等问题。
3 测试试验
3.1 测试准备
当进行基于嵌入式音、视频采集的视频会议处理系统测试试验时,需要准备Raspberry Pi系列嵌入式视频会议终端,搭建局域网(LAN)环,调制解调器用于接入互联网、Logitech C920系列的USB摄像头、Blue Yeti系列的麦克风阵列、Samsung Galaxy S21系列的智能手机以及LG 27UK850-W系列27英寸4K分辨率的显示屏,以观察视频输出。同时,还需要准备OpenH264系列音视频编解码软件、Wireshark网络性能测试工具以及VQ-AMS视频质量评估软件。调试摄像头和麦克风,配置嵌入式设备的音、视频输入、输出参数,保证音视频信号采集正常。在整个测试过程中,需要详细记录测试结果,并根据结果对系统进行调整优化。
3.2 测试结果
为了验证基于嵌入式音、视频采集的视频会议处理系统的性能,需要进行一系列测试试验,评估系统在实际运行中的视频和音频采集、编码、传输以及系统的稳定性等关键指标。该系统的测试结果见表2,每个测试项都包括预期的目标值、实际测量到的值以及是否符合预期目标。
由表2可知,在视频采集方面,预期目标是1920ppi×
1080ppi的分辨率和30f/s的帧率,实际测量结果表明,系统能够稳定地采集到ppi1920×1080ppi分辨率的视频,并且帧率几乎达到了30f/s,只轻微降至29.97f/s。这表明视频采集模块能够按照设计要求工作,仅有的帧率小幅度下降在可接受范围内,不会对视频流畅度产生显著影响。视频编码使用的是H.264压缩算法,实际测量的平均延迟为95ms,该值小于预设的100ms目标,表明在视频编码过程中几乎没有增加延迟,同时,使用AAC压缩算法的音频编码表现良好,实际测量的平均延迟为45ms,该值低于预设的50ms目标,说明音频编码过程对通信的实时性影响较小,能够有效提升音、视频的数据采集质量。深度学习去噪技术的PSNR值为32.5dB,远超预期目标。系统在动态码率调整方面也表现出良好的网络适应性,调整精度在预期范围内。这些结果表明,本文设计的系统在视频和音频采集、编码质量方面均达到预期目标,能够为用户提供流畅、稳定的视频会议体验。
4 结语
本文针对嵌入式音、视频采集在视频会议系统中的应用问题,提出了一种基于嵌入式技术的视频会议处理系统设计,并经过一系列严格的测试试验,最终解决了音、视频数据采集质量不高等问题。同时,该系统适用于资源受限的移动或嵌入式设备,为视频会议在各种场合的普及提供了技术保障,也提供了一种高效、稳定且安全的嵌入式音、视频采集和处理方案。随着技术发展,未来研究中需要进一步提高系统的处理速度,探索如何在不同网络环境下保持稳定的视频质量,还需要采用更先进的加密和安全性措施,并利用人工智能进行视频内容识别和优化,以使基于嵌入式技术的视频会议处理系统更完善,更好地满足用户的需求。
参考文献
[1]涂珂.基于嵌入式音视频采集的视频会议处理系统设计[J].网络安全技术与应用,2023(6):55-56.
[2]马骥.基于ARM嵌入式平台的音视频解码播放系统设计与实现[J].微型电脑应用,2023,39(8):229-232.