登录
|
注册
|
QQ账号登录
|
常见问题
联系我们:
我要上传
首页
浏览
幼儿/小学教育
中学教育
高等教育
研究生考试
外语学习
资格/认证考试
论文
IT计算机
经济/贸易/财会
管理/人力资源
建筑/环境
汽车/机械/制造
研究报告
办公文档
生活休闲
金融/股票/期货
法律/法学
通信/电子
医学/心理学
行业资料
文学/艺术/军事/历史
我的淘豆
我要上传
帮助中心
复制
下载此文档
方1052-数据仓库与数据挖掘 实验报告.docx
文档分类:
IT计算机
|
页数:约20页
举报非法文档有奖
分享到:
1
/
20
下载此文档
搜索
下载此文档
关闭预览
下载提示
1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
2.下载该文档所得收入归上传者、原创者。
3.下载的文档,不会出现我们的网址水印。
同意并开始全文预览
(约 1-6 秒)
下载文档到电脑,查找使用更方便
下 载
还剩?页未读,
继续阅读
分享到:
1
/
20
下载此文档
文档列表
文档介绍
方1052-数据仓库与数据挖掘 实验报告.docx
1
石家庄铁道大学四方学院
学生实验报告书
21
实验课程名称学生专业班级学生学号学生姓名指导老师姓名
数据仓库与数据挖掘
方1052信管
刘
三、实验小结、建议及体会
基于“学生成绩分析”主题数据仓库多维模型的建立,能很好地满足高校老师和学生对学生成绩信息进行快速查询以及分析的需要,为更多其他主题数据仓库的建立奠定了基础。然而各主题数据仓库的建立,只是一个开始,我们下一步工作将是在建立好的数据仓库基础上进行数据挖掘,进一步去发现隐藏在这些学生成绩信息数据中更加有用的知识、规律和模式,使之为学校学生成绩分析工作服务。
将数据仓库技术应用到学生信息管理中,使我了解了数据仓库的应用以及如何创建数据仓库。
22
实验项目名称
Apriori算法
实验成绩
实验日期
2013年9月28日
第一部分:实验分析与设计
一、实验内容描述(问题域描述)
此实验为综合型实验,要求学生综合利用先修课程高级程序设计语言、数据库、算法设计与分析,与本门数据挖掘课程的知识,选择一种编程工具,如VisualC++,实现经典挖掘算法Apriori或算法k-Means。
二、实验基本原理与设计(包括实验方案设计,实验手段的确定,试验步骤等,用硬件逻辑或者算法描述)
Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。算法基于这样的事实:算法使用频繁项集性质的先验知识。Apriori使用一种称作逐层搜索的迭代方法,k-项集用于探索(k+1)-项集。首先,找出频繁1-项集的集合。该集合记作LI。L1用于找频繁2-项集的集合L2,而L2用于找L3,如此下去,直到不能找到频繁k-项集。找每个Lk需要一次数据库扫描。
为了提高频繁项目集逐层产生的效率,Apriori算法利用了两个重要的性质用于压缩搜索空间:
若X是频繁项集,则x的所有子集都是频繁项集。
若x是非频繁项集,则X的所有超集都是非频繁项集。
:
算法:Apriori算法,使用逐层迭代找出频繁项集。
输入:事务数据库D;最小支持度阈值min_sup。输出:D中的频繁项集L。
L1=find_frequent_1_itemsets(D);
for(k=2;Lk-1工;k++){
Ck=aproiri_gen(Lk-1,min_sup);
foreachtransactiontD{//scanDforcount
Ct二subset(Ck,t);//getsubsetsoftthatarecandidates
foreachcandidatecCt
++;
}
Lk={cCk|}
}
returnL=UkLk;
从事务数据库D中挖掘出所有频繁项集。支持度大于最小支持度min_sup的项集Itemset称为频集FrequentItemset。首先需要挖掘出频繁1-项集;然后,继续采用递推的方式来挖掘频繁k-项集(k〉1),具体做法是:
在挖掘出候选频繁k-项集(Ck)之后,根据最小置信度minSup来筛选,得到频繁k-项集。最后合并全部的频繁k-项集(k〉0)。
挖掘频繁项集的算法描述如下:
L1=find_frequent_1-itemsets(D);//挖掘频繁1-项集,比较容易
for(k=2;Lk-1工①;k++){
Ck=apriori_gen(Lk-1,min_sup);//调用apriori_gen方法生成候选频繁k-项集
foreachtransactiontuD{//扫描事务数据库D
(5)
Ct二subset(Ck,t);
23
(6)
foreachCandidatecuCt
(7)
++;//统计候选频繁k-项集的计数
(8)
}
(9)
Lk={cuCk|}//满足最小支持度的k-项集即为频繁k-
项集
(10)
}
(11)
returnL=UkLk;//合并频繁k-项集(k〉0)
基于第1步挖掘到的频繁项集,继续挖掘出全部的频繁关联规则。置信度大于给定最小置信度minConf的关联规则称为频繁关联规则FrequentAssociationRule。在这一步,首先需要从频繁项集入手,首先挖掘出全部的关联规则(或者称候选关联规则),然后根据minConf来得到频繁关联规则。
挖掘频繁关联规则的算法描述如下:
初始状态:L=UkLk;AR=0;//L是频繁项集集合,AR是频繁关联规则集合
forall入k(入k是L的元素,是一个k-频繁项集,
方1052-数据仓库与数据挖掘 实验报告 来自淘豆网www.taodocs.com转载请标明出处.
猜你喜欢
端午粽子教案点评
3页
学校事故应急处置培训ppt课件
29页
立体编织纸条教案
3页
行政人事管理培训ppt课件
31页
科学答题技巧教案
3页
一节初中数学课的教学设计
4页
新高一数学同步培训ppt课件
26页
种植碗豆尖教案
3页
神奇小豆小班教案
3页
社团制作腐乳教案
3页
社会新朋友教案
3页
礼貌儿歌教案中班
3页
乡村振兴驻村帮扶培训ppt课件
27页
硬笔坐姿备课教案
3页
石膏几何素描教案
3页
相关文档
更多>>
非法内容举报中心
文档信息
页数
:
20
收藏数
:
0
收藏
顶次数
:
0
顶
上传人
:
guoxiachuanyue005
文件大小
:
698 KB
时间
:
2022-08-02
相关标签
除草合同
云服务合同
平安保险合同
暖气安装合同
采购代理合同
个人用工合同
工伤后解除劳动合同
商品房转让合同
土地转包合同
延保合同
计算机原理
PHP资料
linux/Unix相关
C/C++资料
Java
.NET
windows相关
开发文档
管理信息系统
软件工程
网络信息安全
网络与通信
图形图像
行业软件
人工智能
计算机辅助设计
多媒体
软件测试
计算机硬件与维护
网站策划/UE
网页设计/UI
网吧管理
电子支付
搜索引擎优化
服务器
电子商务
Visual Basic
数据库
Web服务
网络资源
Delphi/Perl
Python
CSS/Script
Flash/Flex
手机开发
UML理论/建模
并行计算/云计算
嵌入式开发
计算机应用/办公自动化
数据结构与算法
SEO
最近更新
护理安全与法律ppt课件
护理8s管理ppt课件
策划书之十年同学聚会策划案
的护理 ppt课件
产褥期专业护理ppt课件
中班语言说课稿3篇
宁德小吃项目融资方案
女装网络项目融资方案
服装滞销品处理方案
晨光推广方案
方案设计合同
方案套餐名称
搬家设备方案
护肤品活动方案
打开技术方案
房地产团购营销方案
《保险公司经营管理》课件
检验基本知识培训 53
幼儿肥胖教学设计方案中班
布展策划方案
工程安全文明施工专项方案
工作提交方案
基于Matlab的挖掘机工作装置优化设计
万人起诉率专题报告
幼儿园托育服务项目章程范本
AutoLISP从入门到精通初级教程(新手必备)
眼科中医护理常规
一掌经(完整整理)
企业法律风险调查问卷
高三班任课教师会议
在线
客服
微信
客服
QQ
客服
意见
反馈
手机
查看
返回
顶部