下载此文档

数据挖掘实验报告.doc


文档分类:IT计算机 | 页数:约14页 举报非法文档有奖
1/14
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/14 下载此文档
文档列表 文档介绍
数据挖掘实验报告.doc:..学生学号0120810680330实验课成绩实验课程名称开课学院指导老师姓名学生姓名学生专业班级武汉理工大学学生实验报告书数据挖掘计算机科学与技术学院 赵倩软件0803班2010—2011学年第二学期实验课程名称:数据挖掘实验项目名称数据仓库的设计、实现及多维分析实验成绩实验者赵倩专业班级软件0803班组别同组者实验日期2011年5月19E1第一部分:实验分析与设计一、 实验内容描述问题描述:此实验为设计型实验,选择一种数据仓库管理系统,如SQLServerAnalysisManager进行数据仓库的设计、实现,并进行多维数据分析。二、 实验基本原理与设计三、主要仪器设备及软件环境WindowsxpSQLServer2000第二部分:实验调试与结果分析一、 调试过程(包括调试方法描述、实验数据记录,实验现彖记录,实验过程发现的问题等)如何向多维数据集添加度疑值:度呈值是要进行分析的数据库屮的量化值。常用的度量值为销售、成本和预算数据。度量值根据多维数据集不同的维度类别进行分析。“欢迎”步骤,单击“下一步”按钮。“从数据源中选择事实数据表”步骤,展开“教程”数据源,然后单击“sales_fact_1998”«“浏览数据”按钮可以査看"sales_fact_1998"表中的数据。数据浏览完毕后,关闭“浏览数据”窗口,然后单击“下一步”按钮。,在“事实数据表数据列”下,双击“store_sales”。对“store_cost”和“imit_sales”列重复此步骤,然后单击“下一步”按钮。二、 实验结果及分析(包括结果描述、实验现象分析、影响因索讨论、综合分析和结论等)运行结果为:第一步,建立系统数据源连接第二步,启动AnalysisManager笫三步,建立数据库和数据源笫四步建立多维数据集1、如何建立时间维度2、如何建立产站维度3、 如何建立客户维度4、 如何生成商店维度5、 完成多维数据集的牛成6、设计存储和处理多维数据集性能与大<1、50O00.//403020O5・*>然后单击爭始S聚合是预先计算好的汇总数据》利用这些数据可加快对多錐数据集的查询。聚合选项「醬十占用的存储空间达到阿prpa性能提升达到(E) p^o-%r直到单击售止"(o继续(0) |停止(D|重置®已定义22个聚合(,40%){上一步(I)I下一步(吵>1取消I|r::ziwzzil7、浏览多维数据集数据(1)使用多维数据集浏览器杳看多维数据集数据-Jnlx|■多维数齬集浏蹩禺-Sales双击某一成员可浅化或深化-[二送就二帮助(也I(2)替换网格中的维度(3)按时间筛选数据(4)深化三、实验小结、建议及体会基于“学牛成绩分析”主题数据仓库多维模型的建立,能很好地满足高校老师和学牛对学生成绩信息进行快速杳询以及分析的需要,为更多其他主题数据仓库的建立奠定了基础。然而各主题数据仓库的建立,只是一个开始,我们下一步工作将是在建立好的数据仓库基础上进行数据挖掘,进一步去发现隐藏在这些学生成绩信息数据中更加有用的知识、规律和模式,使之为学校学生成绩分析工作服务。将数据仓库技术应用到学生信息管理中,使我了解了数据仓库的应用以及如何创建数据仓库。实验课程名称:数据挖掘实验项目名称Apriori算法实验成绩实验者赵倩专业班级软件0803班组别同组者实验日期2011年5月26日第一部分:实验分析与设计一、 实验内容描述(问题域描述)此实验为综合型实验,要求学生综合利用先修课程高级程序设计语言、数据库、算法设计与分析,与木门数据挖掘课程的知识,选择一种编程工具,如VisualC++,实现经典挖掘算法Apriori或算法k-Meanso二、 实验基本原理与设计(包括实验方案设计,实验手段的确定,试验步骤等,用硕件逻辑或者算法描述)Apriori算法是一种最冇影响的挖掘布尔关联规则频繁项集的算法。算法基于这样的事实:算法使用频繁项集性质的先验知识。Apriori使用一种称作逐层搜索的迭代方法,斤-项集用于探索(G1)-项集。首先,找出频繁1-项集的集合。该集合记作门。灯用于找频繁2■项集的集合L2,\^L2用于找仃,如此下去,直到不能找到频繁4项集。找每个弘需耍一次数据库扫描。为了提高频繁项目集逐层产生的效率,Apriori算法利用了两个重要的性质用于压缩搜索空间:(1)若X是频繁项集,则x的所有子集都是频繁项集。(2)若x是非频繁项集,则X的所冇超集都是非频繁项集。:算法:Apriori算法,使用逐层迭代找岀频繁项集。输入:事务数据库D;

数据挖掘实验报告 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数14
  • 收藏数0 收藏
  • 顶次数0
  • 上传人小博士
  • 文件大小1.51 MB
  • 时间2019-08-05