下载此文档

基于用户访问行为分析的网站分类研究.pdf


文档分类:IT计算机 | 页数:约72页 举报非法文档有奖
1/72
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/72 下载此文档
文档列表 文档介绍
中国优秀硕士学位论文全文数据库 2011年 第S1期 信息科技辑
Chinese Master's Theses Full-text Database 2011, Information Science and Technology I139-247-1
基于用户访问行为分析的网站分类研究

贾梦青
学位授予单位: 郑州大学; 学科专业: 计算机应用技术

摘 要

随着 Internet 和 WWW 的迅猛发展,网站的数量也越来越多,而且网站包含了海量的、异构的、动态的信
息资源,利用数据挖掘中的分类技术对这些网站进行组织归纳,从而有效地管理资源、改善网站服务满足用户
需求,已日益成为一个重要的研究课题。目前的网站分类研究是以文本分类为基础的,需要分析网页内容,且
以单个网页为处理对象,计算量大,不适合处理大规模流数据。另一方面,网站正从“以站点为中心”朝着“以
用户为中心”的方向发展,而这种基于文本的分类方法从网页的静态内容出发,分类结果不能体现用户的行为
特点。
针对传统的基于内容的网站分类方法存在的问题,本文提出了一种基于用户访问行为分析的网站分类
方法,该方法把具有相同 URL 前缀的网页的集合(即 URL 主机名相同的网站)作为一个处理对象,降低了数据
规模;其次采集河南省教育科研计算机网真实的 HTTP 协议业务流数据作为分析对象,从用户对网站的访问
行为中提取用于网站分类的特征,不需要逐个分析网页内容;最后针对省级区域性网络数据规模大的特点,采
用可伸缩性决策树归纳算法,从河南省教育科研计算机网用户访问的网站中提取出新闻类网站、资源共享类
网站和通讯类网站。
与传统的网站分类方法相比,本文提出的方法更适合处理大规模数据,且得到的分类结果包含了用户的
潜在行为模式,更能反映用户的兴趣趋向和行为规律,从而使网管人员有针对性的优化网络,满足用户对主流
应用的需求。

关键词:用户行为分析;;HTTP 数据流;;网站分类;;决策树

中图分类号:

Abstract

With the rapid development of Internet and WWW, the number of the websites becomes extremely large. The
website contains abundant, isomeric and dynamic information resources. Using data mining technology for
classification, which can effectively manage these information resources to impro

基于用户访问行为分析的网站分类研究 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数72
  • 收藏数0 收藏
  • 顶次数0
  • 上传人莫欺少年穷
  • 文件大小5.95 MB
  • 时间2021-10-17