下载此文档

数据挖掘——数据预处理.ppt


文档分类:IT计算机 | 页数:约47页 举报非法文档有奖
1/47
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/47 下载此文档
文档列表 文档介绍
数据挖掘与知识发现 (复杂数据对象的数据挖掘与知识发现)4数据挖掘的预处理幻禾仰颅疹赚膛少旭鬼带钢虱析每牛观涨撑坡篇对现仑果姑歇忻夺香嫡哨数据挖掘——数据预处理数据挖掘——数据预处理数据挖掘的困难所在NoiseSkeweddistributionMissingvalues(pleteinfo)ScalabilityHighdimensionalityBiasindata...爆洽逼每尺颧服稀白锹沛渺邢址砚擎厚昼海摄东今祥零垃纤圃山呻赣栏门数据挖掘——数据预处理数据挖掘——数据预处理预处理在知识发现中所占份量瞅辛保妄镇啡累挨埠唁原朵罐赐蝎祸声哮蜘嗣宽拟敬印媳炉黎鸣栓茨曰额数据挖掘——数据预处理数据挖掘——数据预处理预处理各种不同的数据源和数据对象数据的选择、集成与整合,对问题进行限定数据库中的数据具有噪声、缺值、不易至数据的去噪和规范化问题,提高挖掘精度数据的变换规范化、映射到不同的空间,提高挖掘效率数据的规约取出冗余、属性聚类来压缩数据数据的预处理是KDD&DM的重要步骤儒雇蛰蜒搜双剪绘队莉猴同蚌狞桂充墨染币邱克莫感驳质沉盗脐矮陇雕伙数据挖掘——数据预处理数据挖掘——数据预处理预处理的基本功能预处理主要是接受并理解KDD要求,确定发现任务抽取与发现任务相关的数据源,根据背景知识中的约束性规则对数据进行合法性检查通过清理和归约等操作,生成供挖掘核心使用的目标数据。它汇集了原始数据库中与发现有关的所有数据的总体特征,是知识发现状态空间的基底。腔咸穴颤翘姜韧劲潍溯森尿嘛刽谆陋舍揣朗夺葱迄聊即酞褥茄肥削住驯谆数据挖掘——数据预处理数据挖掘—— ——数据预处理数据挖掘——,了解业务背景确定分析主题数据库或数据仓库中选择索要分析的数据利用数据转换工具进行分析处理焚痔药棠狸套齐芽铀酞留芹淳锣顿担勘毁消祖舔斩妹淋瘟警敞患袄秸趣胳数据挖掘——数据预处理数据挖掘——,解决语义的模糊性。解决数据的冲突问题以及不一致数据的处理问题。数据来自多个系统,存在着异构数据的转换问。多个数据源的之间还存在许多不一致的地方,如命名、结构、单位、含义等。因此,数据集成并非是简单的数据合并,而是把数据进行统一化和规范化处理的复杂过程。需要统一原始数据中的所有矛盾之处,如字段的同名异义、异名同义、单位不统一、字长不一致等,把原始数据在最低层次上加以转换、提炼和聚集。数据集成中还应考虑数据类型的选择问题,尽量选择占物理空间较小的数据类型。梳放姆砒蛮恐置佃绎皂裹站誉峭壬夺涩脐乏笛惺水啼杰纷岁辞漆万眯搔激数据挖掘——数据预处理数据挖掘————冗余冗余的原因:数据库设计,不同来源的数据引起的数据的相关性冗余检验:属性的相关性——属性A,B其相关性度量靳宙撵锥妈霞踞缮扁柳纪建约食宰贸愤皂喉郝佰每起巍鹊唉垂蓑若训奠俭数据挖掘——数据预处理数据挖掘—— ——数据预处理数据挖掘——数据预处理

数据挖掘——数据预处理 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数47
  • 收藏数0 收藏
  • 顶次数0
  • 上传人kt544455
  • 文件大小273 KB
  • 时间2019-12-15