长沙理工大学
硕士学位论文
基于粗糙集理论的关联规则挖掘研究
姓名:童舟
申请学位级别:硕士
专业:计算机软件与理论
指导教师:罗可
20070301
摘要随着大规模数据库的广泛使用和的迅猛扩展,全球范围内数据库中存储的数据量迅速增大。海量的数据未能充分利用这一现象常常被描述为“数据丰富,但知识贫乏”。如何从这些海量数据中发现知识,导致了数据挖掘领域的出现。世纪年代初由甈状翁岢龅拇植诩理论适用于处理和提取含糊性和不精确性的知识,近年来由于在数据挖掘等领域得到了成功的应用而受到国际上广泛关注。基于租糙集理论的属性约简和规则冗余值约简能够降低属性的维数,总结出适用于决策支持的知识规则,这是粗糙集理论在数据挖掘邻域最重要应用之一。如今,关联规则广泛应用于各个领域,而算法效率不高,规则冗余度较大,用户仅对一部分关联规则感兴趣是目前关联规则挖掘算法普遍存在的问题,因此,将粗糙集理论与关联规则提取这两种方法的综合,从大量的数据中迅速挖掘用户感兴趣的关联规则是有现实意义的,曾有人提出过这种构思,但无建模、实现等更深入的工作。本文对粗糙集理论和关联规则挖掘算法进行了深入而系统的研究,在总结现有方法的基础上,首先提出了一种基于差别矩阵的高效求核算法和基于差别矩阵的属性相对约简和规则提取方法,能够对知识系统进行处理,方便后面的决策规则提取,随后,在惴ɑ∩咸岢隽艘恢执崧塾虻墓亓9嬖蛲诰蚰P停并提出了一种全新的挖掘正负关联规则的算法。接下来,深入分析了冗余规则产生的原因,提出了一种对频繁项集进行约束的算法,从而减少冗余规则的生成。最后,探讨了已有有效规则评判标准的利弊。其中,详细说明了各个改进后的算法的思想和步骤,并将基于粗糙集的关联规则挖掘原型系统作用于实验数据库,获得了较好的结果,证实了原型系统的有效性。关键词:数据挖掘;粗糙集;关联规则:结论域;冗余规则
假曲,觚綾瑃ば禿蛐瑃鷘鵥∞加譹沁狧Ⅸ琣谢∞衄吼∞锄磆柚蛐衄辬.’~∞—,赾弛柚,鰊鹤勰膕酢眃綢矗鏻硒猰皀器弱籹膕,勰,,甈緄Ⅱ,鹐産,;Ⅱ
童备日期:,。哼年午月日学位论文原创性声明日期:知呻年彳日学位论文版权使用授权书导师签名:零三广长沙理工大学日期:订年争月上‘日本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权长沙理工大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于⒈C芸冢年解密后适用本授权书。⒉槐C芡拧朐谝陨舷嘤Ψ娇蚰诖颉啊獭
⒄的现象。如何有效地使用这些数据却成为了一个问题,数据挖掘正是为解决这类问题而发展起来的一门技术,它是指从数据库或数据仓库的大量数据中揭示出隐含的、先前未知的、潜在有用的信息的非平凡过程,⋯等人提出的,它不但可以帮助人们从数据库,特别是数据仓库的相关数据中提取出所感兴趣的知识、规律,而且也可以帮助人们从不同程度上去分析它们,从而可以更有效地利用数据库或数据仓库中的据库中知识发现过程的一个核心步骤,许多学者将其视为数据库中知识发现的同垂峥煜仍瓿霭媪薑技术专刊。而后从年开始,每年主办一次恃趸嵋椋獽和方面的研究推向了高潮,综合各相关研究领域的共同兴趣和努力,迎接从大型数据库中开采有用知识的挑技术研究最高水平的国际学术会议上,对难芯慷颊加薪洗蟮谋壤琄已经成为当今计算机科学与技术研究、应用的热点领域之一。此外,数据库、人当今世界,数据每天都在迅猛地增长,经常出现“数据丰富而知识缺乏”数据;再者,它不仅可以用于描述过去数据的发展过程,而且还能进一步预测未来的发展趋势。数据挖掘技术自诞生以来,关注的目光就一刻也没有转移过,年在第届国际人工智能联合会议奶致刍嵘希状翁岢鍪菘庵械闹J斗现,简称技术,而数据挖掘可视为数义词,不再将虳餮细竦厍帧腒从此,“数据挖掘”一词开始流行。第一本关于墓恃踉又尽禗芬灿月创刊发行。亚太地区于年在新加坡首次召开了恃跹刑只。年正式成立了奶乇鹦巳ば∽镾其宗旨就是要战。目前,在,,甋却砣斯ぶ悄苡胧菘工智能、信息处理、知识工程等领域的学术刊物也纷纷开辟了ㄌ饣蜃ǹ上也有不少缱映霭嫖铮渲幸园朐驴禟长沙理工大学硕士毕
基于粗糙集理论的关联规则挖掘研究 来自淘豆网www.taodocs.com转载请标明出处.