更新时间:2023-01-07 23:30
结构方程模型是社会科学研究中的一个非常好的方法。该方法在20世纪80年代就已经成熟。“在社会科学以及经济、市场、管理等研究领域,有时需处理多个原因、多个结果的关系,或者会碰到不可直接观测的变量(即潜变量),这些都是传统的统计方法不能很好解决的问题。20世纪80年代以来,结构方程模型迅速发展,弥补了传统统计方法的不足,成为多元数据分析的重要工具。
这一组潜在变量分别是那些观测变量中的某几个的线性组合。在技术上,通过验证观测变量之间的协方差,可以估计出这个基本线性回归模型的系数值,从而在统计上检验所假设的模型对所研究的过程是否合适,也就是检验观测变量的方差协方差矩阵与模型拟合后的引申方差协方差矩阵的拟和程度,如果证实所假设的模型合适,就可以得出结论:我们所假设的潜在变量之间的关系是合理的。
一般采用路径图(pathdiagram)的形式表示结构方程式模型,这是最简单、最直观的描述模型的方法,研究人员可以借助路径图直接和明了地将变量之间的关系以图形的方式表现出来。流行的AMOS软件可以直接利用路径图的模型设定进行分析,并将分析结果直接标识在图。习惯上,在路径图潜在变量用椭圆型表示,观测变量用矩形表示;如果两个潜在变量之间有相互关系,用双箭头联结这两个潜在变量;如果两个潜在变量是因果关系,则用单箭头联结这两个潜在变量,箭头指向结果变量。如果一个潜在变量可由若干观测变量表示,这个潜在变量被看作观测变量的因子(factor),用单箭头联结这个潜在变量与观测变量,箭头指向观测变量,表示潜在变量直接影响了观测变量的值。在因果关系模型中,影响其它变量而其自身的变化又假定是由因果关系模型外部的其它因素所决定的变量称之为外生变量(exogenousvariable),由外生变量和其它变量解释的变量称为内生变量(endogenousvariable)。
在SEM中,所假设的潜在变量之间的关系模型,是一种关于传播理论的临时的基本模型,我们称之为结构模型(structuralmodel);而那些在统计显著的观测变量与测量的潜在变量之间的线性关系模型,称之为度量模型(measurementmodel)。结构模型实际上是某种意义上的回归模型,要做的工作是验证这个模型是否合适,也就变成了估计潜在变量之间相应的回归系数(路径系数)的值,而度量模型便是估计这些回归系数的依据。
结构方程是模型的目标就是再生一个观测变量的引申方差协方差矩阵Σ,使之与样本方差协方差矩阵S尽可能地接近,同时评价模型对数据的拟合程度。如果引申的方差协方差矩阵Σ与样本方差协方差矩阵S之间的差别非常小,也就是残差矩阵各个元素接近于0,就可以认为模型拟合了数据。
关于模型的总体拟合程度有许多测量指标和标准,对模型的评价,涉及到模型对数据的总的拟合程度,AMOS软件提供了多种判定拟合优度的量。用户可以在模型上面直接给出拟合统计量,显示统计量结果。
1.卡方统计量(X2)
最常用的拟合指标是拟合优度的卡方检验(X2-goodness-of-fittest)统计量。在最大似然估计ML、一般最小二乘法GLS和广义加权最小二乘法ADF下,卡方值X2等于样本量减1乘以拟合函数的最小值。
在观测变量服从多元正态分布且模型设定正确的话,如果分析方差协方差矩阵,则乘积服从卡方分布(或渐进服从卡方平方分布)。这里需注意,它的检验正好与传统的统计研究相反,我们希望得到的不显著的卡方值,大的值对应差的拟合,小的值对应于好的拟合。事实上,这里的卡方检验是“拟合劣度(badness-of-fit)”检验,很小的卡方值说明模型拟合很好。但是,卡方检验统计量与样本量的大小密切相关,当样本量越大,卡方值也越大,拒绝一个模型的概率就会随着样本量的增加而增加,也就是说,最好把卡方检验看成是度量拟合优度的量,而不是把它当作检验统计量。为减小样本量对拟合检验的影响,习惯上采用卡方值与自由度之比,如果比值小于2,则可以认为模型拟合较好。
2.拟合优度指数(GFI)
拟合优度指数(goodness-of-fitindex)GFI度量了观测变量的方差协方差矩阵S在多大程度上被模型引申的方差协方差矩阵所预测,如果Σ=S,GFI=1,意味着模型完美拟合。
3.修正的拟合优度指数(AGFI)
修正的拟合优度指数(adjustedgoodness-of-fitindex)AGFI利用模型中参数估计的总数与模型估计的独立参数—自由度来修正,估计的参数相对于数据点越小,AGFI越接近GFI。
以上两个指数都在0和1之间,较大的数对应于较好的拟合,一般大于0.9时,则认为模型拟合观测数据。与X2不同的是,GFI和AGFI不是样本容量的函数,因为它们并不是统计量,只是测量了样本方差中估计方差所占的加权比例,因此不能用来对模型的拟合优度进行统计检验。
4.平方平均残差的平方根(RMR)
平方平均残差的平方根(rootmeansquareresidual)RMR度量了拟合残差的一种平均值,说明样本方差和协方差在假定模型正确的情况下的估计值的差异,RMR越小,说明拟合较好,如果RMR等于0,表明模型完美拟合。
5.本特勒-波内特规范指数(NFI)
本特勒-波内特规范指数(Bentler-Bonettnormedfixindex)是从设定模型的拟合(或是拟合函数,或用卡方值)与独立模型(independencemodel)的拟合之间的比较。独立模型是指假设所有变量之间没有相关关系,也就是说,模型中所有的路径系数和外生变量之间都固定为0,只估计方差。用来比较设定模型与独立模型在拟合上的改善程度。
6.近似误差的平方根(RMSEA)
近似误差的平方根(rootmeansquareerrorofapproximation)。习惯上,RMSEA取值小于0.05,表明相对于自由度模型拟合了数据;另外,建议在90%的置信度下,如果RMSEA取值小于0.08,则可认为近似误差是合理的,或者说在置信水平0.01下不能拒绝这一假设。RMSEA评价指标近年来越来越受到重视。
7.信息标准指数(informationcriteriaindex)
信息标准测量是为了作不同模型的比较,信息标准测量的值越小说明含独立估计参数越少的模型拟合越好,也就是说简约模型(parsimoniousmodel)越好。一般在设定的理论模型中,使用同一数据,按照理论减少模型中某个或某几个自由参数,比较某种信息标准指数的差异,选择指数最小的模型,也就是简约模型。
需要强调的是,虽然这里给出了许多评价模型拟合指数,但是没有唯一的模型拟合标准指数是正确的。所以,在模型拟合过程中,要尽量纳入各种指标,并尽可能地了解各种指数的内在含义,这可能完全需要研究者来判断。
实际应用中,研究者还需要对度量模型和结构模型的可靠性和有效性进行必要的检验,一般可根据经典的检验理论,采用复相关系数和总决定系数说明单个观测变量或全部观测变量作为潜在变量的度量指标的可靠程度,以及单个或全部外生潜在变量对内生潜在变量的方差效应。
此外,模型及拟合的标准并不完全是统计问题,即使一个模型拟合了数据,也不意味着这个模型是“正确的”或是“最好的”。因为可能存在着等价模型(equivalentmodels),竞争模型(competingmodels)。如果简单模型的拟合与复杂模型的拟合一样好,就应该接受简单模型,因为,我们的目标就是建立简约模型,也就是说模型中的参数越少越好。因此,结构方程式模型的模型策略简单就是美,最重要的是所有估计参数应该有实际意义,能够得到合理的解释,研究者始终应该将结构方程式模型建立在有说服力的理论假设上。
1.同时处理多个因变量
结构方程分析可同时考虑并处理多个因变量。在回归分析或路径分析中,就算统计结果的图表中展示多个因变量,其实在计算回归系数或路径系数时,仍是对每个因变量逐一计算。所以图表看似对多个因变量同时考虑,但在计算对某一个因变量的影响或关系时,都忽略了其他因变量的存在及其影响。
态度、行为等变量,往往含有误差,也不能简单地用单一指标测量。结构方程分析容许自变量和因变量均含测量误差。变量也可用多个指标测量。用传统方法计算的潜变量间相关系数,与用结构议程分析计算的潜变量间相关系数,可能相差很大。
3.同时估计因子结构和因子关系
假设要了解潜变量之间的相关,每个潜变量者用我个指标或题目测量,一个常用的做法 是对每个潜变量先用因子分析计算潜变量(即因子)与题目的关系(即因子负荷),进而得到因子得分,作为潜变量的观测值,然后再计算因子得分,作为潜变量之间的相关系数。这是两个独立的步骤。在结构方程中,这两步同时进行,即因子与题目之间的关系和因子与因子之间的关系同时考虑。
4.容许更大弹性的测量模型
传统上,我们只容许每一题目(指标)从属于单一因子,但结构方程分析容许更加复杂的模型。例如,我们用英语书写的数学试题,去测量学生的数学能力,则测验得分(指标)既从属于数学因子,也从属于英语因子(因为得分也反映英语能力)。传统因子分析难以处理一个指标从属多个因子或者考虑高阶因子等有比较复杂的从属关系的模型。
5.估计整个模型的拟合程度
在传统路径分析中,我们只估计每一路径(变量间关系)的强弱。在结构方程分析中,除了上述参数的估计外,我们还可以计算不同模型对同一个样本数据的整体拟合程度,从而判断哪一个模型更接近数据所呈现的关系。