下载此文档

基于WEB挖掘的站点设计的研究.pdf


文档分类:IT计算机 | 页数:约68页 举报非法文档有奖
1/ 68
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/ 68 下载此文档
文档列表 文档介绍
基于诰虻恼镜闵杓频难芯广东工业大学学位论文周琪锋分类号:学校代号:论文提交日期:论文答辩日期:密级:学号:墨
摘要在际跹该头⒄沟慕裉欤娑訵上浩如烟海的数据信息,如何帮助人们有效地收集、选择和存储所感兴趣的信息以及在日益增多的信息中发现新的概念和它们之间的关系,使之能做到信息处理的自动化,已成为现今研究的热点问题。而数据仓库和数据挖掘技术,就是帮助人们从海量信息中进行智能的、自动的抽取和精化有价值的知识,从中揭示出蕴含在这些数据背后的客观世界的内在联系和规律,解决社会发展中的实际问题并用于宏观辅助决策的。如何对系暮A啃畔⒔懈丛拥挠τ茫饩鍪莸挠τ弥柿课题,充分利用有用的数据,是当今数据挖掘技术的最重要的应用。尽管传统的数据库技术和数据挖掘技术已经取得了飞速的发展并且日趋完善,但由于萁峁沟奶厥庑裕沟么臣际醪荒苤苯佑τ迷赪的信息挖掘中。罩臼菔羌锹加没Ф訵站点访闯信息的数据。保存有大量用户访问路径信息,从罩局蟹⑾钟杏玫男畔⑹欠浅1匾5模哉庑┬畔⒌分析有利于设计人员掌握用户的喜好和访问习惯,网站设计人员应考虑调整网站结构,对用户比较关心的实时信息查询加大投入力度,找出一个如何更好地去优并能提高网站的可维护性,让丰富、便捷的网站提高教育网的办公自动化。传统的关联规则技术是从包含一组事务记录的数据库中发现一些事务项目问关系的信息。本文的工作将致力于关联规则的概念引入到诰蛳低持校将用户的访问路径以关联规则的形式表现出来,其目的在于从用户访问超文本系统的行为中发现用户的访问模式。因此,挖掘的关联规则可帮助我们了解用户的关注所在,可更好地组织站点内的畔⒔峁梗=淌Α⒔逃芾碚叩忍峁重要的、有价值的信息。本文在综述关联规则发现、萃诰蚍掷唷⒀芯磕谌莺湍壳把芯肯肿的基础上研究了罩就诰虻幕恚魅妨薟用户访问日志挖掘研究难点在于:如何对原始日志数据进行预处理;如何设计有效的挖掘算法。针对这两个难题,本文研究及总结了预处理技术,利用诰蛩惴ㄋ枷耄岢隽送ü化网站结构的策略,确定预传那些网页到客户端,以便更好地为访问用户服务,
:至:些盔兰:堡竺:兰堡丝兰访问路径挖掘分析用户浏览模式的方法,实现了一种有效的访问路径模式挖掘算法,并将其应用及实践于高校教育网中。关键词:数据挖掘罩痉梦事肪赌J焦亓9嬖
,,琾—,,—.—
:至三兰盔::堡篓:兰丝兰兰..:,,珹甀.,.珹
独创性声明秉承学校严谨的学风与优良的科学道德,本人声明所呈交的论文是我个人在导师的指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,不包含本人或其他用途使用过的成果。与我一同工作的同志对本研究所做的任何贡本学位论文成果是本人在广东工业大学读书期间在导师的指导下取得的,论文成果归广东工业大学所有。申请学位论文与资料若有不实之处,本人承担一切相关责任,特此声明。献均已在论文中作了明确的说明,并表示了谢意。指导论文广东荡笱程硕卜学位论文
第滦髀研究背景研究内容般的数据库操作难以得到有效的知识。近几年数据挖掘技术不断的发展完善,为目前已经发展成为拥有近亿个工作站、数十亿页面的分布式信息空间,在这个分布式信息空间中蕴涵着具有巨人潜在价值的知识,也带来了巨大的经济效益和社会效益。对于不同层次、不同使用目的和爱好的浏览者需要个性化的信息服务,希望网站能够根据自己的浏览习惯,动态定制镜悖迪指鲂曰匿溃欢杂谕站的经营管理者来说,为提高网站的声誉和效益,需要了解其客户需要什么和想做什么,其中包括根据大多数客户的共同兴趣,开展有针对性的信息服务,,包括;用户的地址、访问时间、访问的页面、访问的方式、版本号、返回码、传输字节数、引用页的取然而即使对于一个热门的小型网站,其罩臼菀部赡芤悦刻焓椎速度增长,人工分析和处理这些日志数据一般来说是不可能的。解决这个问题的途径之一就是将传统的数据挖掘技术应用于从海量的日志数据中自动、快速地发现用户的访问模式,如频繁访问路径、频繁访问页组、用户聚类等。没Х梦市畔⑼诰蛩玫降哪J郊扔兄谔岣咄镜男阅芎桶全性,也可以作为优化站点拓扑结构及页面之间的超链接关系的依据,也是在辖惺谐】7⒑涂U沟缱由涛窕疃囊谰荩部梢宰魑M疚S没峁└性化服务和构建智能化镜愕囊谰荩上写娲⒌男畔⒘烤薮笄胰狈峁够橹墓嬲裕嬉獾散布在的各个角落;同时罩揪哂泻A康氖荩哉庑┦萦靡畔⒌拇砗陀行褂锰峁┝擞行У墓ぞ摺D壳埃琖数据挖掘已成为数据挖掘的一个重要应用领域。萃诰蜓芯糠治A嚼啵夯赪内容的挖掘和基于用户访问日志的挖第一章绪论
:至:::盔:三堡筌:俭盟坷研究意义掘。谌菔萃诰蚴谴游牡档哪谌莼蛘呙枋鲋谐槿≈J叮康氖鞘

基于WEB挖掘的站点设计的研究 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数 68
  • 收藏数 0 收藏
  • 顶次数 0
  • 上传人 DOC KING
  • 文件大小 0 KB
  • 时间2011-12-01
最近更新