: . 一、属性选择: 1、理论知识: 见以下两篇文章: 数据挖掘中的特征选择算法综述及基于 WEKA 的性能比较_陈良龙 数据挖掘中约简技术与属性选择的研究_刘辉 2、weka 中的属性选择 2.1 评价策略(attribute evaluator) 总的可分为 filter 和 wrapper 方法,前者注重对单个属性进行评价,后者侧 重对特征子集进行评价。 Wrapper 方法有:CfsSubsetEval Filter 方法有:CorrelationAttributeEval 2.1.1 Wrapper 方法: (1)CfsSubsetEval 根据属性子集中每一个特征的预测能力以及它们之间的关联性进行评估,单 个特征预测能力强且特征子集内的相关性低的子集表现好。 Evaluates the worth of a subset of attributes by considering the individual predictive ability of each feature along with the degree of redundancy between them.Subsets of features that are highly correlated with the class while having low intercorrelation are preferred. For more information see: M. A. Hall (1998). Correlation-based Feature Subset Selection for Machine Learning. Hamilton, New Zealand. (2)WrapperSubsetEval Wrapper 方法中,用后续的学****算法嵌入到特征选择过程中,通过测试特征 : . 子集在此算法上的预测性能来决定其优劣,而极