生物与农业工程学院闵可夫斯基距离多元统计分析主要内容2一、闵可夫斯基距离•1.曼哈顿距离•2.欧氏距离•3.切比雪夫距离•4.各种距离的优缺点二、曼哈顿距离和切比雪夫距离的关系三、闵可夫斯基距离的SPSS实现𝑑𝑖𝑗𝑞=𝑥𝑖𝑘−𝑥𝑗𝑘𝑞𝑝𝑘=11/𝑞其中:𝑑𝑖𝑗表示样品i和样品j之间的距离𝑞表示阶数,通常取值𝑞=1,2或+∞K表示每个样品的指标数,𝑘=1,2,⋯,𝑝一、Minkowski距离闵可夫斯基距离(MinkowskiDistance)又闵氏距离,是一组距离的定义,其计算公式为:根据q取值的不同,闵氏距离可分为曼哈顿距离、欧式距离和切比雪夫距离等。当q=1时的一阶Minkowski距离称为绝对值距离,又叫做曼哈顿距离(ManhattanDistance):𝑑𝑖𝑗1=𝑥𝑖𝑘−𝑥𝑗𝑘𝑝𝑘=1曼哈顿距离标明两个点在标准坐标系上的绝对轴距总和1.曼哈顿距离指标1指标2样品112样品22312323样品2样品11.曼哈顿距离例:当q=2时,二阶Minkowski距离称为欧几里得距离或欧式距离(Euclideandistance):𝑑𝑖𝑗2=𝑥𝑖𝑘−𝑥𝑗𝑘2𝑝𝑘=1欧式距离是坐标系内两点的直线距离2.欧氏距离12323样品2样品12.欧氏距离指标1指标2样品112样品223例:当𝑞→∞时,Minkowski距离可以转化为切比雪夫距离(Chebyshevdistance):𝑑𝑖𝑗∞=lim𝑞→∞𝑥𝑖𝑘−𝑥𝑗𝑘𝑞𝑝𝑘=11/𝑞=max1≤𝑘≤𝑝𝑥𝑖𝑘−𝑥𝑗𝑘其中:𝑑𝑖𝑗表示样品i和样品j之间的距离𝑞表示阶数,通常取值𝑞=1,2或+∞K表示每个样品的指标数,𝑘=1,2,⋯,𝑝3.切比雪夫距离4.各种距离的优缺点9曼哈顿距离和切比雪夫距离常用于机器学习。欧氏距离常用于多元统计分析。计算闵式距离时常对数据进行标准化或中心化。闵式距离没有考虑变量间的相关关系。1.将与原点的曼哈顿距离为1的所有点画在笛卡尔坐标系中,构成一个正方形ABCD。如下图所示,蓝线构成的正方形上,所有点距离原点(0,0)的曼哈顿距离均为1。-1.5-0.50.51.5-1.5-0.50.51.5提示:该正方形的函数表达式为:𝑥−0+𝑦−0=1二、曼哈顿距离和切比雪夫距离的关系曼哈顿距离2.同样将与原点的切比雪夫距离为1的所有点画在笛卡尔坐标系中,构成一个正方形A’B’C’D’。如下图所示,绿线构成的正方形上,所有点距离原点(0,0)的切比雪夫距离均为1。提示:该正方形的函数表达式为:max(𝑥−0,𝑦−0)=1-1.5-0.50.51.5-1.5-0.50.51.5二、曼哈顿距离和切比雪夫距离的关系切比雪夫距离-1.5-0.50.51.5-1.5-0.50.51.5旋转45度-1.5-0.50.51.5-1.5-0.50.51.5(1)切比雪夫距离,向右旋转45度(2)旋转后横纵表坐标缩小2二、曼哈顿距离和切比雪夫距离的关系3.将切比雪夫距离构成的正方形A’B’C’D’旋转45度,如下图。多元分析中,以距离为基础的统计方法常通过坐标旋转的方式,以达到转换或简化数据的目的。-1.5-0.50.51.5-1.5-0.50.51.5-1.5-0.50.51.5-1.5-0.50.51.5(2)旋转后横纵表坐标缩小2(3)变换后的切比雪夫距离二、曼哈顿距离和切比雪夫距离的关系4.将图(2)的横纵坐标同时缩小2倍,得到变换后的切比雪夫距离。变换后的切比雪夫距离即是曼哈顿距离。-1.5-0.50.51.5-1.5-0.50.51.5-1.5-0.50.51.5-1.5-0.50.51.5(3)变换后的切比雪夫距离(4)曼哈顿距离二、曼哈顿距离和切比雪夫距离的关系变换后的切比雪夫距离即是曼哈顿距离。品种性状1性状2性状3性状4品种1125254品种2136262品种3134951品种4135355品种5535355品种6535857品种7635555品种8735656品种9545554品种10545655导入SPSS三、闵可夫斯基距离的SPSS实现三、闵可夫斯基距离的SPSS实现三、闵可夫斯基距离的SPSS实现将测定的性状或指标导入变量窗口。将品种或样品导入标注个案窗口。点击度量设定所要计算的距离。三、闵可夫斯基距离的SPSS实现选择“Chebychev距离”,可计算切比雪夫距离。选择“Minkowski距离”,可计算曼哈顿距离和欧式距离。三、闵可夫斯基距离的SPSS实现当“幂”的值设定为1,计算出的距离为曼哈顿距离。当“幂”的值设定为2,计算出的距离为欧式距离。三、闵可夫斯基距离的SPSS实现Minkowski(1)表示计算的是曼哈顿距离。此时“幂”的值设定为1.表格下方的不相似矩阵,表示计算的是样品间的距离,而不是相似程度。