下载此文档

数据挖掘读书笔记.docx


文档分类:IT计算机 | 页数:约7页 举报非法文档有奖
1/7
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/7 下载此文档
文档列表 文档介绍
数据挖掘读书笔记导语:数据挖掘是一项较新的数据库技术,它基于由日常积累的大量数据所构成的数据库,从中发现潜在的、有价值的信息——称为知识,用于支持决策。以下本人为大家介绍数据挖掘读书笔记文章,欢迎大家阅读参考! 数据挖掘读书笔记1 1、数据挖掘要解决的问题可伸缩高维性异种数据和复杂数据数据的所有权与分布非传统的分析 2、数据挖掘任务 1)预测任务 2)描述任务 A预测建模:分类-预测离散的目标变量和回归-预测连续的目标变量 B关联分析 C聚类分析 D异常检测 3、属性的四种类型 1)标称 2)序数 3)区间 4)比率数据挖掘读书笔记2 ,,但要探索的问题应是有预见的,为了数据挖掘而数据挖掘则带有盲目性,是不会成功的. 1)数据清理消除噪声或不一致数据。 2)数据集成多种数据源可以组合在一起 3)数据选择搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据. 4). ,其余一切工作都能自动地完成. ,通常会用到可视化技术. . 3、数据挖掘热点电子商务网站的数据挖掘在对网站进行数据挖掘时,所需要的数据主要来自于两个方面:一方面是客户的背景信息,此部分信息主要来自于客户的登记表;而另外一部分数据主要来自浏览者的点击流,此部分数据主要用于考察客户的行为表现。但有的时候,客户对自己的背景信息十分珍重,不肯把这部分信息填写在登记表上,这就会给数据分析和挖掘带来不便。在这种情况之下,就不得不从浏览者的表现数据中来推测客户的背景信息,进而再加以利用。就分析和建立模型的技术和算法而言,网站的数据挖掘和原来的数据挖掘差别并不是特别大,很多方法和分析思想都可以运用。所不同的是网站的数据格式有很大一部分来自于点击流,和传统的数据库格式有区别。因而对电子商务网站进行数据挖掘所做的主要工作是数据准备。生物基因的数据挖掘生物基因数据挖掘则完全属于另外一个领域,在商业上很难讲有多大的价值,但对于人类却受益非浅。例如,基因的组合千变万化,得某种病的人的基因和正常人的基因到底差别多大?能否找出其中不同的地方,进而对其不同之处加以改变,使之成为正常基因?这都需要数据挖掘技术的支持。对于生物信息或基因的数据挖掘和通常的数据挖掘相比,无论在数据的复杂程度、数据量还有分析和建立模型的算法而言,都要复杂得多。从分析算法上讲,更需要一些新的和好的算法。现在还远没有达到成熟的地步。文本的数据挖掘在现实世界中,可获取的大部分信息是存储在文本数据库中的,由来自各种数据源的大量文档组成。由于电子形式的信息量的飞速增长,文本数据库得到飞速的发展。文档数据库中存储最多的数据是所谓的半结构化数据(semistructuredata),它既不是完全无结构的,也不是完全结构化的。在最近数据库领域研究中已由大量有关半结构化数据的建模和实现方面的研究。

数据挖掘读书笔记 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数7
  • 收藏数0 收藏
  • 顶次数0
  • 上传人feng1964101
  • 文件大小18 KB
  • 时间2019-07-15