基于报文差分的隧道传输压缩研究
2024-09-26郑自永
摘 要:在传统网络传输中涉及不同协议层的数据嵌套封装,然而越多层次的协议封装嵌套就会增加越多的头部字节的开销,如何更为有效地利用网络带宽,减少冗余数据的传输,一直以来都是高效传输技术研究的热点。通过对不同隧道网络数据的切片化细分及研究,公开了一种基于报文差分的隧道传输压缩方法,用于压缩不同隧道传输方式的报文,主要针对各种VPN客户端与服务端强化升级,包括PPTP、L2TP和IPSec等隧道传输方式。对隧道内网络切片进行相关性分析,对IP报文进行端到端的对等报文差分压缩与解压,充分利用了隧道内不同网络切片中传输报文间的相似特质,采用lzo、zlib等传统压缩算法,提高了端到端隧道传输的带宽使用效率,为网络隧道传输提供了行之有效的切片化压缩技术支撑。
关键词:报文差分;数据压缩;隧道传输;网络切片
中图分类号:TN929.5 文献标识码:A 文章编号:2096-4706(2024)14-0009-04
Research on Tunnel Transmission Compression Based on Message Differentiation
ZHENG Ziyong
(Comba Network Systems Co., Ltd., Guangzhou 510663, China)
Abstract: In traditional network transmission, data nesting and encapsulation at different protocol layers are involved. However, the more layers of protocol encapsulation and nesting, the more overhead the header bytes will be. How to more effectively utilize network bandwidth and reduce redundant data transmission have always been the hot topics in efficient transmission technology research. By slicing and studying data from different tunnel networks, a tunnel transmission compression method based on message differentiation has been disclosed, which is used to compress messages of different tunnel transmission methods. It mainly focuses on strengthening and upgrading various VPN clients and servers, including PPTP, L2TP, and IPSec tunnel transmission methods. The correlation analysis of network slice within the tunnel is conducted, and the end-to-end compression and decompression of peer-to-peer message differentiation for IP message are carried out. It fully utilizes the similar characteristics between transmitted messages in different network slice within the tunnel, and uses traditional compression algorithms such as lzo and zlib to improve the bandwidth utilization efficiency of end-to-end tunnel transmission, providing effective slicing compression technology support for network tunnel transmission.
Keywords: message differentiation; data compression; tunnel transmission; network slice
DOI:10.19850/j.cnki.2096-4706.2024.14.003
0 引 言
在有线通信领域经常涉及隧道技术[1-2],比如虚拟隧道网络VPN(Virtual Private Network)广泛应用在互联网、2G/3G/4G/5G通信接入网等,比如PPTP、L2TP和IPSec等隧道形式的网络嵌套传输,带宽紧张时影响传输服务质量、人为增加带宽的成本有时也较为昂贵,报文压缩的技术诉求便油然而生。围绕报文压缩需求,兼顾隧道内原始报文间的相似特质,引入了报文差分的思路,优化固定带宽下的传输效率,且基于报文差分的压缩方法,在不同网络隧道应用中的实现方式完全一致,具有高效的压缩可移植性。
在网络隧道传输中,越多网络嵌套的形式下,数据传输的冗余也越来越多,往往传递很小的数据载荷[3],比如语音,其携带冗余头开销很大。为了解决冗余技术难题,基于报文差分的隧道传输压缩的研究,在分析网络隧道中网络报文之间的相似特质,将其切片化分类,并引入了报文差分再压缩的思路,结合传统lzo、zlib等压缩算法,很大比重上压缩了隧道内报文大小,节省了传输带宽资源。尤其在隧道内还有隧道的多重网络嵌套场景,更多层次的报文间相似特质、差分后具有更小的信息熵、更大的压缩效率,从而更大程度提升了传输效率、保障了同等带宽下的服务质量,极大地降低了各种虚拟隧道网络的实施难度。
1 网络传输的问题
现有网络在隧道传输领域中,报文压缩技术的压缩效果大多依赖所传报文具体内容,报文内容不确定性越大、信息熵越大、压缩效果越差,反之则压缩效果越好。对单一报文独立压缩往往效果不佳,并不能减少网络隧道各种头部封装带来的冗余。相邻报文之间也是独立的,传统传输技术未考虑报文之间的相关性,而隧道内报文间相关性很强的字节是普遍存在的,甚至完全相同,使深度压缩具有一定基础。
此外,网络建设已进入深度覆盖时期,在很多场景下,没有增加传输带宽的可能,比如:山区、乡村,人口密度低,网络安装困难,传输配置较低;城市城中村,人口密集,建筑复杂,网络资源竞争多;海事船舶上,网络带宽昂贵、传输资源有限;诸多网络场景,都存在传输带宽不够、传输效率较低问题。
最终,在不增加网络传输带宽的情况下,如何压缩隧道传输中的冗余数据,提高网络带宽利用率,便成为热门技术难题,根据当下的市场需求与技术困境,基于报文差分的隧道压缩研究[4-6],提出了“依据相关性、分析网络报文,进行报文压缩,解决报文冗余的问题”“在报文压缩上,引入相关性、切片分析,解决压缩率不足的问题”两个解决问题的核心点,最终使得隧道报文压缩率可达30%,最大幅降低了虚拟隧道业务的传输对现有网络的要求,从而在不增加带宽的条件下,提高了传输服务质量。
2 隧道传输压缩技术实施
2.1 传输压缩技术概要
现有网络传输技术中,大量的协议封装,例如HTTP、RTP、TCP、UDP、IP等,在无线基站通信中,还包括GTP、VPN(IPSec)等二次网络封装[7-8],导致类似语音等的小包传输成本高、效率低,头部开销远远大于载荷本身;另外就具体载荷本身,相邻报文间也存在一定的相关性,在隧道传输中的分组报文,可以通过头部和载荷相关性分析,同时结合相关压缩算法[9],减少数据冗余,提高分组传输效率。
图1描述了如何通过深入分析原始报文、选择参考报文、执行差异分析处理与压缩、结合压缩信息头,灵活高效地压缩网络隧道中的分组报文,在业界首次对网络分组报文进行相关性分析、降低信息熵值、压缩减少传输信息量,使原有网络中分组间冗余、重复的信息得到大幅削减,整体数据量减少68%,提高了网络带宽资源的利用效率。
传输压缩研究首次提供了动态灵活的压缩方案,支持压缩算法灵活调整,通过压缩头交互,在压缩与解压端同步进行处理,具备了压缩隧道切片特性,整体实施有了很强的扩展性。针对不同的网络隧道分组、不同的网络切片,生成不同的参考报文,每个隧道分组都能够进行获取最强的相关性、最优的压缩效果,实现了隧道分组压缩的切片化,图2描述了不同隧道传输中的不同切片化数据流,其在压缩与解压两端之间的数据传输大致框架。
在上述基础上,基于报文差分的隧道传1Fpb/vT/kw3lXPodsyDpimYl1xDlSuAZq9rCd6SpH9k=输压缩方法还灵活了兼容多种压缩算法,实时交互、可变更、可组合,使得整个网络隧道分组报文的压缩更为合理,兼具相关性熵值削减与分组无损压缩的两大技术优势。
2.2 报文差分的传输压缩
为了进一步压缩隧道内原始报文大小,提升传输效率,结合了隧道内传输报文间相似的特质,采用lzo、zlib等类似开源压缩算法,将相近报文差分后得到更小的信息熵、更大的压缩效率,更大程度地压缩冗余数据、保障同等带宽下的传输服务质量。
充分利用隧道内所传输报文间的相关性,将隧道网络精准切片化,采用相近报文差分后再压缩的方法,从时间维度提升压缩率,提升隧道传输效率。
基于报文差分的隧道传输压缩方法,其包括隧道传输业务中的客户端与服务端,对等处理压缩与解压流程,其包括客户端压缩/解压、服务端压缩/解压,端到端对等实现,其中不同切片的隧道压缩采用不同参考报文的进行差分环节处理。
其中,基于报文差分的隧道压缩,需新增压缩信息头,同步压缩/解压端的处理,包括以下内容:
1)参考报文标识,用标识区分参考报文,更新参考报文时加1。
2)压缩算法标识,0:无压缩,1:lzo算法,2:zlib算法,3:other算法。
3)当前报文标识,0:参考报文,1:压缩报文。
此外,压缩端可以设置压缩参数,包括以下内容:
1)压缩算法标识,1:lzo算法,2:zlib算法,3:other算法。
2)参考报文间隔,相邻参考报文之间压缩报文的个数,比如:参考报文间隔为3,表示每发一个参考报文,后续发3个与其相关的压缩报文;3个压缩报文发完之后,会更新并发送新的参考报文。
基于报文差分的隧道压缩方法,具有鲜明的技术优势与特征,如下:
1)对网络报文进行相关性分析、减少冗余,提升压缩效果。
2)相关度高的报文,其熵值更小,压缩效果更好。
3)无损压缩、算法灵活,网络报文降冗余后再压缩,效果显著。
4)深度解析报文,分析相关性,划分不同的切片,不同切片微通道执行独立的压缩,针对性强、压缩率低。
5)降低了对丢包/时延敏感的业务的带宽损耗,支撑多样隧道网络,如家庭宽带、村通宽带,海事卫星等。
2.3 隧道压缩的处理流程
基于报文差分的隧道传输压缩,包括压缩与解压两个技术点,针对减少数据冗余、提高传输效率的技术需求,提供了一种配套的处理方法及流程,图3、图4描述了压缩解压核心处理环节,包括以下步骤。
2.3.1 压缩环节的处理步骤
步骤S101,接收待发送原始报文,转S102。
步骤S102,判断是否作为参考报文发送,若是转S107,否则转S103。
其中,判断依据为压缩配置参数“参考报文间隔n”,每隔n个报文更新一次、重新发送参考报文,从而提高报文之间的相关性,持续得到更好的差分效果。在时间上相邻越近的报文之间往往具有较好的相关性,即相似度,包括多层封装头部的相似度、传输载荷之间的相似度。
步骤S103,将原始报文-参考报文做差分处理,得到新报文,转S104。
步骤S104,根据压缩算法标识选择压缩算法,将差分后新报文执行相应压缩处理,转S105。
步骤S105,封装压缩信息头,转S106。
其中,压缩信息头内容:参考报文标识:ReferPackId、压缩算法标识:1(lzo)、当前报文标识:1(压缩报文),lzo算法为举例,也可选择其他压缩算法。根据参考报文标识,解压端可以轻松地找到参考报文,在结合压缩算法,解压缩端可以进行解压缩处理,从而得到原始报文。
步骤S106,封装隧道各层头部信息,PPTP、L2TP和IPSec各自封装各自相应的头部信息,转S110。
步骤S107,更新存储参考报文,转S108。
步骤S108,参考报文标识叠加,ReferPackId++,转S109。
步骤S109,封装压缩信息头,转S106。
其中,压缩信息头内容:参考报文标识:ReferPackId、压缩算法标识:0(无压缩)、当前报文标识:0(参考报文),解压缩端可以根据压缩信息头进行解压同步,得到原始报文。
步骤S110,将数据包发往隧道对端。
2.3.2 解压环节的处理步骤
步骤S201,从隧道内接收封装后的IP报文,转S202。
步骤S202,拆除隧道各层头部信息,PPTP、L2TP和IPSec各自拆除各自相应的头部信息,转S203。
步骤S203,判断是否为参考报文,若是转S207,否则转S204。
其中,根据压缩信息头“当前报文标识”,可判断是否为参考报文,其中参考报文不需要解压,非参考报文需要根据参数报文及其压缩信息头信息,进行解压缩,得到原始报文。
步骤S204,拆除压缩信息头,转S205。
步骤S205,根据压缩信息头“压缩算法标识”,选择压缩算法,将所得报文执行相应解压处理,转S206。
步骤S206,根据压缩信息头“参考报文标识”,选择参考报文,将解压后报文与参考报文做逆差分,得到原始报文,转S209。
步骤S207,更新存储参考报文及其压缩信息头,压缩信息头用以指示逆差分操作,转S208。
步骤S208,拆除压缩信息头,转S209。
步骤S209,将原始数据包发往下游。
根据上述描述的基于报文差分的隧道传输压缩方法,在传输隧道的网络切片化、相关性分析的基础上,进行针对参考报文的差分、再压缩,并且结合了现有的无损压缩算法,比如lzo、zlib等算法,普遍适用于PPTP、L2TP和IPSec等不同的隧道传输形式,图5描述了经过报文差分的隧道压缩前后呈现的压缩效果,可见将多层嵌套隧道网络的传输报文进行相关性分析切片化处理、再差分压缩,能够实现较大程度地压缩削减冗余数据,极大提高了隧道网络的传输效率,为偏远山区、卫星海事等带宽紧缺场景提供了高效的传输服务[10]。
3 结 论
基于报文差分的隧道传输压缩方法研究,在传统隧道传输技术中,引入待传输原始报文间相关性分析,隧道网络报文的切片化隔离处理,采用基于参考报文差分处理再压缩的方法,从时间维度深度压缩报文大小,提升传统隧道传输中报文的传输效率。为网络环境恶劣、带宽紧缺昂贵等特殊场景及客户,提供了高效的技术升级方案,且实际体验效果显著,具有很高的商业价值,极大推进虚拟网络的建设与实施。
参考文献:
[1] 殷振凯,刘培学,王中训,等.民用北斗短报文的船载冷链信息压缩传输方法 [J].单片机与嵌入式系统应用,2023,23(3):16-19.
[2] 李德伟.基于网络数据同步的测绘数据压缩技术研究 [J].自动化技术与应用,2023,42(4):83-86.
[3] 张焕彬,辛拓,梁佳鑫.基于北斗短报文的电力通信信息压缩传输方法研究 [J].电气技术与经济,2023(2):4-6.
[4] 潘涛,佟晓筠,张淼,等.基于压缩感知和超混沌系统的图像压缩加密方法[J].计算机科学,2023,50(S01):724-729.
[5] 李耀莹,孙娟.自适应编码与混合模型联合改进图像压缩算法 [J].机械设计与制造,2023,383(1):179-182.
[6] 钱正浩,曾纪钧,江映燕,等.基于模型压缩的可靠性切片容灾承载方法 [J].微型电脑应用,2023,39(2):67-70+88.
[7] 高振,陈福才,王亚文,等.基于拟态防御的VPN流量劫持防御技术 [J].计算机科学,2023,50(11):340-347.
[8] 雷晓燕.VPN技术在远程办公中的应用及风险应对 [J].通信与信息技术,2020(5):24-25.
[9] 但海涛.考虑互联网多移动节点的数据压缩传输方法 [J].长江信息通信,2023,36(7):177-179.
[10] 饶加旺,王勇,马荣华.文本大数据的智慧城市研究与分析 [J].测绘科学,2020,45(7):170-180.
作者简介:郑自永(1986.09—),男,汉族,河南商丘人,主任协议软件工程师,中级电子技术工程师,硕士研究生,研究方向:无线通信、计算机软件、网络规划。
收稿日期:2024-01-26