更新时间:2023-02-07 00:28
在多要素所构成的系统中,当研究某一个要素对另一个要素的影响或相关程度时,把其他要素的影响视作常数(保持不变),即暂时不考虑其他要素影响,单独研究两个要素之间的相互关系的密切程度,所得数值结果为偏相关系数。
在多元回归分析中,在消除其他变量影响的条件下,所计算的某两变量之间的相关系数。在多元相关分析中,简单相关系数可能不能够真实的反映出变量X和Y之间的相关性,因为变量之间的关系很复杂,它们可能受到不止一个变量的影响。这个时候偏相关系数是一个更好的选择。
假设我们需要计算X和Y之间的相关性,Z代表其他所有的变量,X和Y的偏相关系数可以认为是X和Z线性回归得到的残差Rx与Y和Z线性回归得到的残差Ry之间的简单相关系数,即pearson相关系数。
偏相关系数的计算可以有下面的三种方法(详细的计算方法见参考文章)
1 根据上面的说法,从线性回归的角度计算变量间的偏相关系数,但是这样做很麻烦。
2 迭代法,可以认为简单相关系数为0阶偏相关系数,任何n阶偏相关都可以通过3个(n-1)阶偏相关系数计算出来。
偏相关系数的检验可以有两种方法。一种是t-test,另外一种fisher 转化法。
利用偏相关系数进行变量间净相关分析通常完成两大步:
第一:计算样本的偏相关系数。
利用样本数据计算偏相关系数,反应了两个变量间净相关的强弱程度。在分析变量x1和x2之间的净相关时,当控制了变量x3的线性作用后,x1和x2之间的一阶偏相关系数定义为:
第二:对样本来自的两个总体是否存在显著的净相关进行推断:
1)提出原假设,即两总体的偏相关系数与零无显著差异。
2)选择检验统计量。偏相关分析的检验统计量为t统计量,它的数学定义为:
式中,r为偏相关系数,n为样本数,q为阶数。统计量服从n-q-2个自由度的t分布。
3)计算检验统计量的观测值和对应的概率p-值。
4)决策。如果检验统计量的概率p-值小于给定的显著性水平α,则应拒绝原假设,反之,则不能拒绝原假设。
在多元回归中,应注意简单相关系数只是两变量局部的相关性质,而并非整体的性质。在多元回归中并不看重简单相关系数,而是看重偏相关系数。根据偏相关系数,可以判断自变量对因变量的影响程度;对那些对因变量影响较小的自变量,则可以舍去不顾。