关联规则解决网络拥塞改进方法研究.doc关联规则解决网络拥塞改进方法研究摘要:将数据挖掘技术和网络优化管理相结合,解决网络拥塞问题。该文应用Web预取技术,面向常见的纵向结构事务数据库,提出一种改进的关联规则挖掘算法实现Web页面预取,进而缩短页面下载时延。关键词:数据挖掘;关联规则;Web日志中图分类号:TP311文献标识码:A文章编号:1009-3044(2011)04-0764-02 workBasedonAssociationRules HOUXiao-ting (ScienceDepartment,Xi'anUniversityofArchitectureandTechnology,Xi'an710055,China) Abstract:work,thispaperappliedatechniquenamedwebpre-fetching,,facingthefamiliarverticalstructureinthedesignoftransactiondatabase,itstudiedandusedanimprovingalgorithmofassociationrulestofindfetchingwebpages,andthenshortenedthedelayinthedownloadprocess. Keywords:datamining;associationrules;weblog 的用户数量剧增以及Web服务和网络固有的延迟,网络拥塞使得用户的服务质量得不到很好的保证。网络拥塞根本原因在于用户给网络提供的负载大于网络资源容量和处理能力,表现为上传和下载过程中数据包时延增加,丢弃数增大,上层应用系统性能下降等。由于WebLog中记录着大量的用户访问历史数据,利用Web数据挖掘技术可以从中分析并获取服务特征。本文基于实例研究了如何应用关联规则挖掘算法对WebLog进行网页相关性分析,找到被用户频繁访问的网页组,从而决定当某个网页被某个用户点击浏览时可将哪些网页预先放在该用户端,省去了用户再次请求时重新下载的麻烦,降低时延,还可以优化网页的链接结构。经典的关联规则挖掘算法基于横向结构事务数据库,而大多数数据库系统都采用纵向结构事务数据库,因此,本文对经典关联规则挖掘算法进行了改进研究与实现。 1关联规则挖掘算法[1-2] 算法描述:1)找出所有频繁项集:即所有支持度不低于用户给定的最小支持度的项目集;2)由频繁项集产生强关联规则:即从频繁项集中选择置信度不小于用户规定的最小置信度的规则。其中寻找频繁项集的Apriori算法是关联规则挖掘算法的核心,决定着挖掘关联规则的总体性能。 2网络拥塞解决方法[3-5] 、用户识别、会话识别、路径补充等步骤,实现方法在文献3和文献4中有详细介绍,在此不再阐述,目的是应用预处理方法。 ,对网站中的Web日志记录进行预处理,得到适于挖掘的格式,最后应用关联规则算法找到网页相关性。该网站的部分日志记录经过预处理各个步骤,结果为:1)A-B-F-O-F-B-G;2)A-B-G-B-A-D-K;3)A-D-K-D-A-E-L-R;4)A-E-L-R-L-E-A-B-H;5)I-Q。代表了
关联规则解决网络拥塞改进方法研究 来自淘豆网www.taodocs.com转载请标明出处.