下载此文档

方1052-数据仓库与数据挖掘 实验报告.docx


文档分类:IT计算机 | 页数:约20页 举报非法文档有奖
1/20
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/20 下载此文档
文档列表 文档介绍
1
石家庄铁道大学四方学院
学生实验报告书
21
实验课程名称学生专业班级学生学号学生姓名指导老师姓名
数据仓库与数据挖掘
方1052信管

三、实验小结、建议及体会
基于“学生成绩分析”主题数据仓库多维模型的建立,能很好地满足高校老师和学生对学生成绩信息进行快速查询以及分析的需要,为更多其他主题数据仓库的建立奠定了基础。然而各主题数据仓库的建立,只是一个开始,我们下一步工作将是在建立好的数据仓库基础上进行数据挖掘,进一步去发现隐藏在这些学生成绩信息数据中更加有用的知识、规律和模式,使之为学校学生成绩分析工作服务。
将数据仓库技术应用到学生信息管理中,使我了解了数据仓库的应用以及如何创建数据仓库。
22
实验项目名称
Apriori算法
实验成绩
实验日期
2013年9月28日
第一部分:实验分析与设计
一、实验内容描述(问题域描述)
此实验为综合型实验,要求学生综合利用先修课程高级程序设计语言、数据库、算法设计与分析,与本门数据挖掘课程的知识,选择一种编程工具,如VisualC++,实现经典挖掘算法Apriori或算法k-Means。
二、实验基本原理与设计(包括实验方案设计,实验手段的确定,试验步骤等,用硬件逻辑或者算法描述)
Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。算法基于这样的事实:算法使用频繁项集性质的先验知识。Apriori使用一种称作逐层搜索的迭代方法,k-项集用于探索(k+1)-项集。首先,找出频繁1-项集的集合。该集合记作LI。L1用于找频繁2-项集的集合L2,而L2用于找L3,如此下去,直到不能找到频繁k-项集。找每个Lk需要一次数据库扫描。
为了提高频繁项目集逐层产生的效率,Apriori算法利用了两个重要的性质用于压缩搜索空间:
若X是频繁项集,则x的所有子集都是频繁项集。
若x是非频繁项集,则X的所有超集都是非频繁项集。

算法:Apriori算法,使用逐层迭代找出频繁项集。
输入:事务数据库D;最小支持度阈值min_sup。输出:D中的频繁项集L。
L1=find_frequent_1_itemsets(D);
for(k=2;Lk-1工;k++){
Ck=aproiri_gen(Lk-1,min_sup);
foreachtransactiontD{//scanDforcount
Ct二subset(Ck,t);//getsubsetsoftthatarecandidates
foreachcandidatecCt
++;
}
Lk={cCk|}
}
returnL=UkLk;
从事务数据库D中挖掘出所有频繁项集。支持度大于最小支持度min_sup的项集Itemset称为频集FrequentItemset。首先需要挖掘出频繁1-项集;然后,继续采用递推的方式来挖掘频繁k-项集(k〉1),具体做法是:
在挖掘出候选频繁k-项集(Ck)之后,根据最小置信度minSup来筛选,得到频繁k-项集。最后合并全部的频繁k-项集(k〉0)。
挖掘频繁项集的算法描述如下:
L1=find_frequent_1-itemsets(D);//挖掘频繁1-项集,比较容易
for(k=2;Lk-1工①;k++){
Ck=apriori_gen(Lk-1,min_sup);//调用apriori_gen方法生成候选频繁k-项集
foreachtransactiontuD{//扫描事务数据库D
(5)
Ct二subset(Ck,t);
23
(6)
foreachCandidatecuCt
(7)
++;//统计候选频繁k-项集的计数
(8)
}
(9)
Lk={cuCk|}//满足最小支持度的k-项集即为频繁k-
项集
(10)
}
(11)
returnL=UkLk;//合并频繁k-项集(k〉0)
基于第1步挖掘到的频繁项集,继续挖掘出全部的频繁关联规则。置信度大于给定最小置信度minConf的关联规则称为频繁关联规则FrequentAssociationRule。在这一步,首先需要从频繁项集入手,首先挖掘出全部的关联规则(或者称候选关联规则),然后根据minConf来得到频繁关联规则。
挖掘频繁关联规则的算法描述如下:
初始状态:L=UkLk;AR=0;//L是频繁项集集合,AR是频繁关联规则集合
forall入k(入k是L的元素,是一个k-频繁项集,

方1052-数据仓库与数据挖掘 实验报告 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息