相似性度量 - 知识百科

相似性度量

更新时间：2022-08-25 12:26

相似性度量，即综合评定两个事物之间相近程度的一种度量。两个事物越接近，它们的相似性度量也就越大，而两个事物越疏远，它们的相似性度量也就越小。相似性度量的给法种类繁多，一般根据实际问题进行选用。常用的相似性度是有：相关系数(衡量变量之间接近程度)，相似系数(衡量样品之间接近程度)，若样品给出的是定性数据，这时衡量样品之间接近程度，可用样本的匹配系数、一致度等。相似性的度量方法很多，有的用于专门领域，也有的适用于特定类型的数据，如何选择相似性的度量方法是一个相当复杂的问题，

定义

相似性度量，即综合评定两个事物之间相近程度的一种度量。两个事物越接近，它们的相似性度量也就越大，而两个事物越疏远，它们的相似性度量也就越小。相似性度量的给法种类繁多，一般根据实际问题进行选用。常用的相似性度量有：相关系数(衡量变量之间接近程度)，相似系数(衡量样品之间接近程度)，若样品给出的是定性数据，这时衡量样品之间接近程度，可用样本的匹配系数、一致度等。

用数量化方法对事物进行分类，就必须用数量化方法描述事物间的相似程度。一个事物常常需要用多个变量来刻画，如对一群用p个变量描述的样本点进行分类，则每个样本点可看做是p维空间的一个点，很自然的想到用距离来度量样本点间的相似程度。

基础知识

距离

设Ω是所有样本点的集合，距离是Ω×Ω→的一个函数，满足条件：

（1）正定性：，x,yΩ；d(x,x)=0，当且仅当x=0；

（2）对称性：d(x,y)=d(y,x),x,yΩ；

（3）三角不等式：,x,y,zΩ。