下载此文档

常用距离计算汇总.doc


文档分类:建筑/环境 | 页数:约11页 举报非法文档有奖
1/11
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/11 下载此文档
文档列表 文档介绍
常用距离计算汇总在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement) ,这时通常采用的方法就是计算样本间的“距离”(Distance) 。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。本文的目的就是对常用的相似性度量作一个总结。本文目录: 1. 欧氏距离 2. 曼哈顿距离 3. 切比雪夫距离 4. 闵可夫斯基距离 5. 标准化欧氏距离 6. 马氏距离 7. 夹角余弦 8. 汉明距离 9. 杰卡德距离& 杰卡德相似系数 10. 相关系数& 相关距离 11. 信息熵 1. 欧氏距离(Euclidean Distance) 欧氏距离是最易于理解的一种距离计算方法, 源自欧氏空间中两点间的距离公式。(1) 二维平面上两点 a(x1,y1) 与 b(x2,y2) 间的欧氏距离: (2) 三维空间两点 a(x1,y1,z1) 与 b(x2,y2,z2) 间的欧氏距离: (3) 两个 n 维向量 a(x11,x12, …,x1n) 与 b(x21,x22, …,x2n) 间的欧氏距离: 也可以用表示成向量运算的形式: (4)Matlab 计算欧氏距离 Matlab 计算距离主要使用 pdist 函数。若X 是一个 M×N 的矩阵,则 pdist(X) 将X矩阵M 行的每一行作为一个 N 维向量,然后计算这 M 个向量两两间的距离。例子:计算向量(0,0) 、(1,0) 、(0,2) 两两间的欧式距离 X= [0 0;10;0 2] D= pdist(X,'euclidean') 结果: D= 2. 曼哈顿距离(Manhattan Distance) 从名字就可以猜出这种距离的计算方法了。想象你在曼哈顿要从一个十字路口开车到另外一个十字路口, 驾驶距离是两点间的直线距离吗?显然不是, 除非你能穿越大楼。实际驾驶距离就是这个“曼哈顿距离”。而这也是曼哈顿距离名称的来源, 曼哈顿距离也称为城市街区距离(City Block distance) 。(1) 二维平面两点 a(x1,y1) 与 b(x2,y2) 间的曼哈顿距离(2) 两个 n 维向量 a(x11,x12, …,x1n) 与 b(x21,x22, …,x2n) 间的曼哈顿距离(3) Matlab 计算曼哈顿距离例子:计算向量(0,0) 、(1,0) 、(0,2) 两两间的曼哈顿距离 X= [0 0;10;0 2] D= pdist(X, 'cityblock') 结果: D=123 3. 切比雪夫距离( Chebyshev Distance ) 国际象棋玩过么?国王走一步能够移动到相邻的 8 个方格中的任意一个。那么国王从格子(x1,y1) 走到格子(x2,y2) 最少需要多少步?自己走走试试。你会发现最少步数总是 max( | x2-x1 |,| y2-y1 |)步。有一种类似的一种距离度量方法叫切比雪夫距离。(1) 二维平面两点 a(x1,y1) 与 b(x2,y2) 间的切比雪夫距离(2) 两个 n 维向量 a(x11,x12, …,x1n) 与 b(x21,x22, …,x2n) 间的切比雪夫距离这个公式的另一种等价形式是看不出两个公式是等价的?提示一下:试试用放缩法和夹逼法则来证明。(3)Matlab 计算切比雪夫距离例子:计算向量(0,0) 、(1,0) 、(0,2) 两两间的切比雪夫距离 X= [0 0;10;0 2] D= pdist(X, 'chebychev') 结果: D=122 4. 闵可夫斯基距离(Minkowski Distance) 闵氏距离不是一种距离,而是一组距离的定义。(1) 闵氏距离的定义两个 n 维变量 a(x11,x12, …,x1n) 与 b(x21,x22, …,x2n) 间的闵可夫斯基距离定义为: 其中 p 是一个变参数。当 p=1 时,就是曼哈顿距离当 p=2 时,就是欧氏距离当 p→∞时,就是切比雪夫距离根据变参数的不同,闵氏距离可以表示一类的距离。(2) 闵氏距离的缺点闵氏距离,包括曼哈顿距离、欧氏距离和切比雪夫距离都存在明显的缺点。举个例子: 二维样本( 身高, 体重), 其中身高范围是 150~190 , 体重范围是 50~60 , 有三个样本: a(180,50) , b(190,50) , c(180,60) 。那么 a与b 之间的闵氏距离(无论是曼哈顿距离、欧氏距离或切比雪夫距离) 等于 a与c 之间的闵氏距离, 但是身高的 10c m 真的等价于体重的 10k g 么?因此用闵氏距离来衡量这些样本间的相似度很有问题。简单说来, 闵氏距离的缺点主要有两个: (1) 将各个分量的量纲(scale) , 也就是“单位”当作相同的看待

常用距离计算汇总 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数11
  • 收藏数0 收藏
  • 顶次数0
  • 上传人63229029
  • 文件大小81 KB
  • 时间2017-01-04