下载此文档

P2P流量分类研究.doc


文档分类:IT计算机 | 页数:约12页 举报非法文档有奖
1/12
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/12 下载此文档
文档列表 文档介绍
摘要:p2p流量已经占据了目前互联网带宽的大部分,对p2p流量的有效监控管理已经成为网络服务提供商(isp)迫切解决的问题之一。首先分析了p2p流量分类的研究现状,对现有的各种流量分类技术以及研究成果进行了比较分析,指出了其中存在的问题。接着详细地分析了已发现的p2p流量特征及网络行为特征,对分类器常用的分类算法进行概括总结。最后分析目前p2p流量分类相关研究中的主要问题并给出下一步研究方向。关键词:p2p;流量特征;流量识别;分类算法中图分类号:tp393文献标识码:a文章编号:2095-2163(2013)03-0001-lassificationlugang,zhanghongli近年来,对等网络p2p(peer-to-peer)已广泛应用于文件共享、实时通信、流媒体传输等技术领域。相关研究表明,由全球视角,p2p流量最高可占据整个网络带宽的95%[1]。p2p流量的迅猛增长给网络带宽造成了严重的负担,而且还以其近乎对称的流量模式加剧了网络的拥塞状况。因此,对p2p流量进行分类并加以控制,已经成为p2p网络研究的热点之一。p2p流量分类是利用p2p流量特征,将p2p流量与其他流量,例如e-mail和rtsp(realtimestreamingprotocol,实时流传输协议)等有效区分,以帮助isp为不同的业务提供相应的服务质量。目前,网络设备生产商和网络服务提供商推出各种流量分类技术,例如,端口识别技术,dpi(deeppacketinspection,深层数据包检测)技术,流统计模式识别技术,行为规则匹配技术等等,这些技术从不同的角度对p2p流量进行了识别与控制。sen等人[2]首次提出了流量分类技术的原则要求,即准确性、可扩展性和健壮性。p2p流量分类技术涉及到网络测量、网络行为学、图论、算法设计、统计学、数据挖掘、模式识别等多个基础研究领域。其研究内容可以归结为三个问题:(1)如何在高速网络环境下进行p2p数据的采集分析。流量分类首先要获取数据,而在高速网络环境下,计算及存储资源的限制给p2p流对象的采集分析提出了新的挑战。(2)如何识别p2p流量,将p2p流量与其他流量区分开。(3)如何建立实用的p2p流量模型,以预测和量化p2p流量对网络的影响。这三方面内容分别涉及到p2p的三个研究方向:p2p的流量测量,p2p流量识别,p2p的流量建模。其中,p2p流量测量是p2p流量识别的基础;p2p流量识别又是p2p流量建模的核心。本文第1节介绍p2p流量分类研究现状,对目前各种分类技术进行了比较分析。第2节讨论了p2p系统的特征,第3节介绍了目前常用的流量分类算法。最后,给出目前p2p流量分类的主要研究问题。1p2p流量分类研究现状p2p流量分类技术按其发展的时间顺序,大致可分为基于端口的流量分类,基于深层数据包检测的流量分类、基于流量统计的分类、基于网络行为模式的分类、基于人工智能的流量分类技术和分布式协同分类六种。早期的p2p应用程序使用固定的端口号,所以利用端口即可以识别p2p流量,然而,目前的p2p应用程序使用端口跳变技术和端口伪装技术以绕开流量检测,bleul等人[3]分析directconnect网络得出,在已观察到的端口中,70%的端口仅使用了一次。因此,若仅使用端口进行流量分类,势必会造成较高的误报率和漏报率,该技术已不是目前的主要研究趋势,本节主要研究后五种流量分类技术。[4]统计数据流中包的平均大小,包到达的间隔时间,数据流的平均持续时间等,提出区分大数据块流量(bulk-datatraffic)和流媒体的方法,并且利用启发式方法来识别未知的流量。陈庆章[5]等人指出ftp流量和p2p流量各自的流统计特征。perényi等人[6]分析了skype流量的统计特征并提出skype流量的识别算法。sen[7]等人指出,p2p网络最本质的特征是动态性。动态性体现在两个方面:拓扑的动态性和流量的动态性。而流量的动态性会使得p2p流量在某些情况下不具有区别于其他流量的显著统计特征,例如在一个p2p文件共享的系统中,有两个对等体a和b交换文件,按照流统计的观点,可以利用p2p流量比ftp流量的流持续时间更长、流的总长度更大等特点[5],将p2p流与ftp流区分开。但是如果对等体a失去对下载文件的兴趣,而中途离开p2p系统,那么p2p流就不具有区分ftp流的明显特征了。因此,不应忽略网络行为对流量分类的影响,需要结合p2p网络的行为进一步挖掘p2p系统的动态特征。[10],其误报率大约在8%-12%之间[10]。为提高流量识别的准确率,ka

P2P流量分类研究 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数12
  • 收藏数0 收藏
  • 顶次数0
  • 上传人iris028
  • 文件大小28 KB
  • 时间2020-01-26