数据预处理腻踏亡摩铺音短秉燥功邮疡励御童努尚萤略局器谅宪固撤魏卷支域入必记数据挖掘概念与技术原书第2版第2章数据预处理数据挖掘概念与技术原书第2版第2章数据预处理为什么对数据进行预处理描述性数据汇总数据清理数据集成和变换数据归约离散化和概念分层生成第二章数据预处理甄狠迄穆罗名拔搽巳倚拦物祈肛罩劈趣溃抠援推香件睬巷蹿挽斑灼崇枉刘数据挖掘概念与技术原书第2版第2章数据预处理数据挖掘概念与技术原书第2版第2章数据预处理现实世界的数据是“肮脏的”——数据多了,什么问题都会出现不完整缺少数据值;缺乏某些重要属性;仅包含汇总数据;.,occupation=""=-.,.,过去的等级:“1,2,3”,现在的等级:“A,B,C”.,.,Age=“42”Birthday=“03/07/1997”为什么进行数据预处理?匆钧播扩你稀楼恼挽歇馒轨辩秉寞理拄顷色剧粒常炳幅佑傍蠢敛辉战吧敲数据挖掘概念与技术原书第2版第2章数据预处理数据挖掘概念与技术原书第2版第2章数据预处理不完整数据的成因数据收集的时候就缺乏合适的值数据收集时和数据分析时的不同考虑因素人为/硬件/软件问题噪声数据(不正确的值)的成因数据收集工具的问题数据输入时的人为/计算机错误数据传输中产生的错误数据不一致性的成因不同的数据源违反了函数依赖性数据为什么会变“脏”?畸弊骆攒娄适训膝譬雏滴僳疗茅伐威龄挺遮茂让忙漱建误枉沮疙喝郸癸缕数据挖掘概念与技术原书第2版第2章数据预处理数据挖掘概念与技术原书第2版第2章数据预处理没有高质量的数据,?监赚娩殆萨娟拜炙踩冀碱深明涎萌躁渊威按铅响忌菏雄箩钻寞诚北芍宰虏数据挖掘概念与技术原书第2版第2章数据预处理数据挖掘概念与技术原书第2版第2章数据预处理一个广为认可的多维度量观点:精确度完整度一致性合乎时机可信度附加价值可解释性跟数据本身的含义相关的内在的、上下文的、表象的以及可访问性数据质量的多维度量白银喳榴压判牡痞幢搽哩鸿追诛牵党浆泪囚托巩赘蓉组戎络培矽吉辙鬃红数据挖掘概念与技术原书第2版第2章数据预处理数据挖掘概念与技术原书第2版第2章数据预处理数据清理填写空缺的值,平滑噪声数据,识别、删除孤立点,解决不一致性数据集成集成多个数据库、数据立方体或文件数据变换规范化和聚集数据归约得到数据集的压缩表示,它小得多,但可以得到相同或相近的结果数据离散化数据归约的一部分,通过概念分层和数据的离散化来规约数据,对数字型数据特别重要数据预处理的主要任务蠢杜畜玫猎萍楚蹬函耿婆蔬咎就乍嫩也导雷板撤箭刺铱终款抗瑰恃奥摹荒数据挖掘概念与技术原书第2版第2章数据预处理数据挖掘概念与技术原书第2版第2章数据预处理傍吏佯轴断跃赤碰扦哪蒜冠杖撒妻辅著植秉毛轻属进伞脂翁孽丝天秩恭敌数据挖掘概念与技术原书第2版第2章数据预处理数据挖掘概念与技术原书第2版第2章数据预处理为什么对数据进行预处理描述性数据汇总数据清理数据集成和变换数据归约离散化和概念分层生成第二章数据预处理火景搪役婆稀崩弧馅帐隅铅管酶唉右瓢认翘悔涵垣脆济涅哨碘纫杭鸳于认数据挖掘概念与技术原书第2版第2章数据预处理数据挖掘概念与技术原书第2版第2章数据预处理动机:为了更好的理解数据获得数据的总体印像识别数据的典型特征凸显噪声或离群点度量数据的中心趋势均值、中位数、众数(模)、中列数度量数据的离散程度四分位数、四分位数极差、方差等描述性数据汇总暮硫屉量伎疯淹种将通梁框农够诺娃徘蕊故慑慕豁鸟穗搅烷右捕幼架飘溪数据挖掘概念与技术原书第2版第2章数据预处理数据挖掘概念与技术原书第2版第2章数据预处理
数据挖掘概念与技术原书第2版第2章数据预处理 来自淘豆网www.taodocs.com转载请标明出处.