DPI技术应用发展研究
2018-12-05林坤
林坤
DPI技术应用发展研究
林坤
中国移动通信集团山东有限公司聊城分公司,山东 聊城 252000
DPI技术是一种针对数据包的检测技术。在互联网和大数据越来越发展的今天,这种基于数据包的检测技术得到了广泛的应用。随着“互联网+”行业内容的不断扩展,大数据分析技术在各行各业得到了越来越多的重视。如何快速分析数据是一项非常重要的研究,对于抢占互联网市场有重要的意义。
DPI;技术应用;发展研究
当今社会是互连网时代,也是大数据时代。通过对大数据的分析可以了解更多的信息,包括每个人的衣食品味,甚至可以对一个人的性格进行评价分析,只要有足够的数据。在这种大数据飞速发展的时代,对数据进行处理的方法是非常重要的,尤其是对这种庞大的数据包的处理。这项研究对计算机行业和大数据应用有很大的影响,可以应用在很多领域。
1 DPI技术的简单介绍
DPI技术,也叫深度包检测技术,是基于应用层的一种流量检测和控制技术。这种技术需要读取IP地址,然后对协议中的应用层信息进行分析。目前这种技术主要包括对“特征字”进行识别、对应用层的网关进行识别,以及对行为模式进行识别。
1.1 DPI模块的部署方式
DPI模块的部署主要有旁路式和串联式两种方式。旁路式也就是并联的方式,顾名思义就是在原有流量线路的基础上部署一个并联的线路,对数据进行收集和处理。这种旁支路线路的设置一般是通过流量分离器,例如分光器、流量镜像,利用这些方法对流量进行拷贝[1]。串联式就是将DPI的处理模块串联地设置在用户的应用层流量链路中,对流经的流量进行监控和分析。这两种方法都能很好地对应用层的流量信息进行监控和管理,应根据不同的情况进行合理地选用。
1.2 DPI技术的特点
DPI技术之所以称之为深层包检测技术,其“深层”的含义是相对于传统的数据检测手段来说的。传统的数据检测是基于端口,而DPI技术能够进行更深层次的数据解析,是基于端口的上一层源IP或者目的IP。它的准确性更好,主要特征有如下几点。
第一,DPI技术的研究是在端口识别技术之上进行的,原理上有很大的相似,基本原理都是对数据包进行拆包和分析。不同的地方在于DPI技术可以对数据进行更深层次地处理。除能对数据包的信息进行检测外,DPI技术还能对特征信息进行识别,并对网络的流量信息进行协议识别。DPI技术对特征的识别是建立在自身拥有的特征数据包库基础上的,因此需要对这个数据库进行不断地更新、扩容和维护。
第二,DPI技术是一种简单、高效的端口识别技术。这种技术在识别协议时,首先进行端口的识别,然后是更深层次的数据包识别,这样能够增加整体数据的处理效率。
第三,DPI技术采用的是应用层的网关识别技术,对应用产生的数据可以进行高效地分流和控制,区分信息的数据来源的原地址。因为这样的特征,DPI技术可以更好地识别流量数据的区别,进行分流处理。目前的DPI技术可以识别出将近600种应用协议,基本覆盖了当前网络中常见的网络协议,包括P2P、HTTP、网络电视、流媒体协议等等比较常见的网络协议。
第四,网络的现状是在不停地发展,而且发展的速度非常快,可以说是日新月异,每一天都会有不同的新产品出现。因此需要不断扩容和更新网络协议的数据库,这样才能满足飞速发展的互联网时代的要求,保证DPI技术的识别能力一直满足客户的使用需求。
2 DPI技术的应用举例
DPI技术是一种深层数据包解析技术。这种技术能够高效地进行网络数据流量的分流处理和信息的识别,能够帮助互联网行业的商家对数据进行处理,提供更好的服务[2]。最常见的就是位置的定位,确认位置信息后,推送附近的消息,提供更加便利的信息。另一种是服务行业的差别服务,会根据每个人的喜好,推送相关的服务或者产品的信息。基于大数据的支持,深层数据包的分析技术可以分析每个人的消费和应用层的流量,判断每个人的喜好,然后根据相应的喜好推送相应的服务,这大大增加了互联网服务的机动性,能够进行点对点的服务。
2.1 DPI与SDN技术的结合应用
DPI技术和SDN技术进行组合,能够产生更加强大的功能,出现更大的推动力,让每一个独立的技术都发挥更大的作用。这两者的结合可以很好地优化网络的结构和性能。SDN是一种基于软件的网络结构,可以分离平面状态和平面信息状态,是适合软件网络的一种技术,可以对高集成化的网络进行有效地控制,非常适合软件网络的应用。SDN一般划分为三层,即基础设施层、控制层及应用层。这种分成的结构保证了集成网络的高效运转。基于SDN的网络结构,在结合DPI这种简单、高效的信息处理手段后,会出现相互促进的结果。SDN网络的分成可以更好地帮助SPI技术进行网络的分流,这样DPI可以在一定程度上借鉴原有的分离进行运行,大大降低了DPI设备的数量,可以在网络中设置更少的DPI设备[3]。DPI技术是一种基于应用层的特征识别技术,可以将DPI技术应用于SDN软件网络的应中层中,更方便地进行信息流的特征分析。在数据的高效分析下,SDN能够更好地工作,提供服务,而DPI技术也因为与SDN技术的结合产生了更高效的数据分析效率。
2.2 一种网络报文检测技术
随着网络的快速发展,在良好的网络环境中也存在很多的恶意破坏网站或者各种负面信息。这些不好的方面表现在很多方面,例如有人会利用重新定向的技术对一些主流的网站进行重新定向,然后劫持主流网站,造成用户不能正常访问网站信息,给商家和用户带来非常大的损失。有人会利用重定向技术劫持主流网站后,将地址转移到其他的网站中,这样就可以快速提高另一个网站的访问量。这种跳转是非常常见的,带来了极差的用户体验。跳转的网站一般都是传播不良信息或者违法信息的网站,非常不利于网络文明的建立。还有些人会故意注册很多域名,将这些域名进行重定向,最终指向一个网页,这样也可以提高这一网页的浏览次数[4]。对于这些问题,DPI技术可以很好地解决。相关人员基于DPI技术研发了互联网的报文检测技术,这样就可以对这些网络信息进行分析处理。对互联网数据运用DPI技术进行识别和分析,能够很好地定位全网的报文信息,对网络中存在的重定向问题进行检测和控制。当发现这些重定向的网络域名时便进行拦截,可以很好地解决那些利用客户的感知非法牟利的行为。运用DPI的数据分析手段,可以对用户访问的报文进行细致地分析和运算,可以提取整个网络的重定向报文,监控访问次数多的域名,拦截异常的重定向报文。
2.3 移动互联网的业务感知App和DPI技术的时间关联技术
为了能够对互联网的业务进行实时地感知、监控,需要一种高效的数据处理工具。这种需求就促进了DPI技术在互联网业务感知技术中的应用。最为明显的就是微博、新闻端、人民网、凤凰网这样的信息推送量比较大、用户参与度高的软件。对这些软件信息进行监控是非常必要的,能够保证绝大多数的用户有良好的使用体验,也能对软件中的信息流进行管理。这两者的共同点都是对业务进行实时感知,对用户的体验进行检测。业务感知App布置在用户终端,采集ISP和KQI数据,对用户的体验进行实时感知。DPI技术布置与ECP侧,提取分析用户面和信令面数据,将这两者进行结合就可以提升用户的感知体验。通关时间关联技术,也就是在业务感知App和DPI之中设置时间节点,对信息流进行分段定义。
3 DPI匹配算法
DPI技术作为底层报文的分析工具,它的匹配算法是非常关键的.匹配算法性能的优越可以直接影响DPI系统的性能[5]。DPI匹配算法大致有三种分类,近似匹配算法、正则表达式匹配算法和精确匹配算法。每一种算法都有其优越性,例如精确匹配算法可以在字符串中找到子字符串,而且效率比较高[6]。正则算法可以利用正则表达式获得匹配的结果,目前这种表达式在网络数据中使用得比较多。正则表达式的使用非常广,但是也有些不足,使用的算术式太多就会导致效率的下降。为了改变这种不足,最新的研究主要是改进正则算法[7]。对正则算法进行改进的核心思想是对出现频率较高的特征字符进行搜索,然后进行分组,并将字符改为DFA,这样就可以降低内存的使用和资源的占用。
4 结束语
本文主要阐述了目前深度包检测的基本应用场景、基础算法以及未来的可能性应用。DPI作为数据分析的一种基础工具,在大数据时代对于网络安全以及提升网络运营都具有积极的效果。
[1]程烨,周雁,徐伟杰. 大数据背景下运营商IP城域网DPI部署方案研究[J]. 邮电设计技术,2015(10):62-67.
[2]饶瑾. 深度包检测(DPI)技术浅谈及应用[J]. 信息通信,2014(11):245-246.
[3]徐江红,赵婉芳. 使用DPI技术研究校园网站的用户行为[J]. 微处理机,2013(4):29-32.
[4]潘洁,郗卓宁,林鹏. 基于SDN/NFV的DPI智能化网络体系的构建[J]. 电信科学,201(6):115-119,125.
[5]杨荣,孟进. 深度包检测技术中模式匹配算法分析[J]. 软件导刊,2014(9):45-47.
[6]王凯. 基于DPI系统的改进正则表达式算法[D]. 赣州:江西理工大学,2014.
[7]张巍,陈佼,赵美凯. 深度包检测中一种正则表达式匹配算法的改进[J]. 现代电子技术,2015(5):87-92.
DPI Technology Application Development Research
Lin Kun
China Mobile Communications Corporation Shandong Co., Ltd., Liaocheng Branch, Shandong Liaocheng 252000
DPI technology is a detection technology for data packets. Today, as the Internet and big data are more and more developed, this packet-based detection technology has been widely used. With the continuous expansion of “Internet+” industry content, big data analysis technology has received more and more attention in all walks of life. How to quickly analyze data is a very important research, and it is of great significance to the preemption of the Internet market.
DPI; technology application; development research
TN915.07
A