残差平方和 - 知识百科

残差平方和

更新时间：2024-03-09 14:40

残差平方和是在线性模型中衡量模型拟合程度的一个量，用连续曲线近似地刻画或比拟平面上离散点组，以表示坐标之间函数关系的一种数据处理方法。用解析表达式逼近离散数据的一种方法。在科学实验或社会活动中，通过实验或观测得到变量x与y的一组数据对(xe，ye)（e=1，2，…ə），其中各xe是彼此不同的。人们希望用一类与数据的背景材料规律相适应的解析表达式，y=f(x，c）来反映变量x与y之间的依赖关系，即在一定意义下“最佳”地逼近或拟合已知数据。f(x，c)常称作拟合模型，式中c=(c1，c2，…cə)是一些待定参数。

公式概念

为了明确解释变量和随机误差各产生的效应是多少，统计学上把数据点与它在回归直线上相应位置的差异称为残差，把每个残差平方之后加起来称为残差平方和，它表示随机误差的效应。一组数据的残差平方和越小,其拟合程度越好。

计算

按定义，残差平方和应为

等精度测量：

﹝ ﹞

非等精度测量：

﹝ ﹞

式中是测量数据的残差，为相应的权。在一般情况下

式中，为直接测量参数的估计值。

对于线性参数，残差为

式中

用矩阵形式表示的残差平方和为

﹝ ﹞=

线性参数测量数据的残差平方和可进一步写成

(对等精度测量)

(对非等精度测量)

式中符号的意义与前面相应的的符号一致。

以上给出了残差平方和的一般形式。在具体解算时，从计算方便考虑，对不同的解算方法，残差平方和的计算各有相应的具体方法。

性质

解释变量与残差平方和

残差平方和RSS具有以下性质：

性质1 只有常数项没有其他解释变量的回归方程的RSS和TSS相等，其决定系数为0。

性质2 增加解释变量必然导致RSS减小。因此，如果想降低RSS，只要在回归方程中尽可能地加入解释变量就能达到目的。

性质3 包含常数项全部解释变量的个数K等于样本数n时，RSS为0，决定系数为1。

F检验和t检验之间的关系

在一些场合t检验不仅可以进行双侧检验，也可以进行单侧检验。而F检验没有单侧和双侧的区别。当进行双侧检验的时候两种检验的P值相同。

分布

概率分布

残差带权平方和除以单位权方差服从分布。即

式中自由度f就是平差中多余观测数。由于，，f对于一个平差系统是不变量，与具体采用的平差方法无关。

数学期望和方差

易知的数学期望为

由此可知

即单位权方差为的无偏估计。

且

则有

或

即方差估计的标准差与成正比与成反比。可见自由度f 愈小，方差估计的精度就愈差。

概率表达式

或

分位值，以自由度f和显著水平可由分布表中查得。

免责声明

隐私政策

用户协议

目录 22

0{{catalogNumber[index]}}. {{item.title}}