更新时间:2023-08-19 11:49
残差图是指以某种残差为纵坐标,以其他适宜的量为横坐标的散点图。这里横坐标有多种选择,最常见的选择是:1.因变量的拟合值;2. 某自变量的观察值;3.在因变量的观察值Y1,…,Yn为一时间序列时, 横坐标可取为观察时间或观察序号。通过对残差及残差图的分析,以考察模型假设的合理性的方法,称为残差分析。这些方法比较直观,应用上效果也好,许多统计软件包均能打出残差图。可用它来检查回归线的异常点。在分析测试中常用的散点图是以自变量为横坐标的残差图。
以残差 为纵坐标,以拟合值 或对应的数据观测序号或数据观测时间为横坐标的散点图统称为残差图。残差图是进行模型诊断的重要工具。
为检验建立的多元线性回归模型是否合适,可以通过回归值 与残差的散点图来检验。其方法是画出回归值 与普通残差的散点图 ,或者画出回归值 与标准残差的散点图 ,其图形可能会出现下面三种情况(如图1所示):
对于图1(a)的情况,不论回归值 的大小,而残差 (或 )具有相同的分布,并满足模型的各假设条件;对于图1(b)的情况,表示回归值 的大小与残差的波动大小有关系,即等方差性的假设有问题;对于图1(c),表示线性模型不合适的样本,可能有异常值存在。
对于图1(a),如果大部分点都落在中间(b)部分,而只有少数几个点落在外边,则这些点对应的样本,可能有异常值存在。
以每个 的各个观测值 为点的横坐标,即以自变量为横坐标的残差图。与拟合值 为横坐标的残差图一样,满意的残差图呈现图1(a)的水平带状。如果图形呈现图1(b)的形状,则说明误差是等方差的假设不合适。若呈现图1(c)的形状,则需要在模型中添加 的高次项,或者对 作变换。
设 是残差 的次序统计量,,令
可以证明,若是来自正态分布总体的样本,则点应在一条直线上。因此,若残差的正态QQ图中的点的大致趋势明显地不在一条直线上,则有理由怀疑对误差的正态性假设的合理性;否则可认为误差的正态性假设是合理的。
在MATLAB中,还可以通过rcoplot()函数画出残差个案排序图形,以此来判断样本是否为异常值样本,其使用格式为:rcoplot(r,rint)。
其中,参数r为回归残差,rint为残差的预测区间。