下载此文档

《模式识别》第4章聚类分析.ppt


文档分类:IT计算机 | 页数:约88页 举报非法文档有奖
1/88
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/88 下载此文档
文档列表 文档介绍
§§§§§,属于非监督分类。目的是将一批数据(模式)组成一些“有意义”的集合(聚类)。这个思想在生物学、社会学、医学、地球科学等学科都是很常见的。下面举一个生物学中的例子:假设我们有下列动物:羊,狗,猫,麻雀,海鸥,小毒蛇,金鱼,红色mullet(一种小海鱼,可以吃),蓝色鲨鱼和青蛙。将为它们分成不同的类别,我们需要一定的规则。如果我们用不同的准则来聚类,可以形成不同的结果,如下面所示。引言§、青蛙、海鸥、小毒蛇鲨鱼金鱼、红mullet羊、狗、猫以产后代的方式和是否有肺联合标准来分羊、狗、猫、鲨鱼麻雀、海鸥、小毒蛇、金鱼、青蛙、红mullet以产后代的方式分金鱼、鲨鱼、红mullet羊、麻雀、狗、海鸥……以肺是否存在分金鱼、鲨鱼、红mullet羊、麻雀、狗、海鸥……以生活环境分引言§:1)聚类在生物分类中很常见;2)不同的准则结果有很大差别。人类总是将获取的信息再聚类,否则,不可能处理每个信息后根据每个类的共同特征来表征这个类。比如当我们看见草地上一条狗的时候,我们会推断它的叫声,因为狗的叫声是一个共同特征。聚类过程如下:特征的选择相似性度量聚类准则聚类算法聚类评价聚类结果的解译定义: 对一批没有标出类别的模式样本集,按照样本之间的相似程度分类,相似的归为一类,不相似的归为另一类,这种分类称为聚类分析,也称为无监督分类。相关概念§:分类:用已知类别的样本训练集来设计分类器(监督学****聚类(集群):用事先不知样本的类别,而利用样本的先验知识来构造分类器(无监督学****167;: 把整个模式样本集的特征向量看成是分布在特征空间中的一些点,点与点之间的距离即可作为模式相似性的测量依据。 聚类分析是按不同对象之间的差异,根据距离函数的规律(大小)进行模式分类的。§:聚类分析方法是否有效,与模式特征向量的分布形式有很大关系。若向量点的分布是一群一群的,同一群样本密集(距离很近),不同群样本距离很远,则很容易聚类;若样本集的向量分布聚成一团,不同群的样本混在一起,则很难分类;对具体对象做聚类分析的关键是选取合适的特征。特征选取得好,向量分布容易区分,选取得不好,向量分布很难分开。§:一摊黑白围棋子选颜色作为特征进行分类,用“1”代表白,“0”代表黑,则很容易分类;选大小作为特征进行分类,则白子和黑子的特征相同,不能分类(把白子和黑子分开)。§

《模式识别》第4章聚类分析 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数88
  • 收藏数0 收藏
  • 顶次数0
  • 上传人autohww
  • 文件大小6.24 MB
  • 时间2020-09-29