概化理论 - 知识百科

概化理论

更新时间：2023-12-23 16:59

概化理论是测量理论中最重要的三种理论之一。一般将测量理论分为经典测量理论(CTT)、概化理论（GT）和项目反应理论（IRT）三大类，或称三种理论模型。概化理论从20世纪60年代诞生到1976年提出多元GT，在理论和方法上不断发展，通过改进经典测验理论的数学模型、引进方差分析技术等方法，把分数变异细分为多种来源，为测验决策提供了系统的理论和方法。80年代后期GT迅速发展，与IRT和CTT形成三足鼎立的局面三种测量理论构成了现代人才测评的理论基石。

简介

凡测量都有误差，误差可能来自测量工具的不标准或不适合所测量的对象，也可能来自工具的使用者没有掌握要领，也可能是测量条件和环境所造成，也可能是测量对象不合作所引起。总之产生测量误差的原因是多种多样的，而CTT理论仅以一个E就概括了所有的误差，并不能指明哪种误差或在总误差中各种误差的相对大小如何。这样对于测量工具和程序的改革没有明确的指导意义，只能根据主试自己的理解去控制一些因素，针对性并不强。鉴于此种情况，二十世纪六十至七十年代初，克伦巴赫(Cronbach)等人提出了概化理论简称GT理论。

基本思想

任何测量都处在一定的情境关系之中，应该从测量的情境关系中具体地考察测量工作，提出了多种真分数与多种不同的信度系数的观念，并设计了一套方法去系统辩明与实验性研究多种误差方差的来源。并用“全域分数”(Universe Score)代替“真分数”(True Score)，用“概括化系数，G系数”(Generalizability Coefficent)代替了“信度”(Reliabilty)。

主要内容

概化理论认为，测量的总方差可以分解为代表目标测量的方差成分和构成误差的种种方差成分。测量工作中要加以认识和予应用的心理特质水平是测量目标。而构成测量条件与具体情境关系的因素，称为测量侧面(Facets of Measurement)。如学生阅读能力测验，其目的是对学生阅读能力的测量，因此，阅读能力就成为测量目标，除此外试题的水平和评分者等因素也会影响测验的总变异。这两个因素就是测量侧面。这里对学生阅读能力的测量是在双侧面情境的条件下进行的。测量侧面中的单个事例叫侧面的水平，如有两个评分者甲和乙，则评分者这一侧面就有两个水平。测量侧面又分为随机侧面和固定侧面。随机侧面是指测量侧面中所包含的各水平中是类似水平的随机样本，而非固定不变的侧面，如大规模考试中评分者每次都有可能不同，由这样变化的评分者所组成的测量侧面就称为随机侧面。固定侧面是指在各次实施中测量侧面的所在水平一直保持不变的测量侧面，如标准化的心理测验中测验的项目总是一样，这样的侧面就叫固定侧面。因此，进行测验的标准化就是对某些测量侧面进行固定。固定测量侧面可以减少测量误差，但却会使测量目标变得更为局限。比如，把阅读理解题定为对科技说明文，这时，所测的特质就不再是一般的阅读理解能力，而是特定的对科技说明文的理解能力了。这样，测验所得的分数就不能再推广到原来那么宽广的范围了。

概化理论强调，测量目标是具体的，并不是绝对固定不变的。因而全域分数也就不固定，可以有多种。一方面，当固定侧面时，侧面本身会转化为测量目标的一部分（如对一般阅读理解能力的测量转变为对科技说明文的测量），测量目标要局限化；另一方面，当测量中考察目的与应用需要改变时，测量目标对象就可能完全转移。比如，当作文考试结果是要对考生作判断时，测量目标就是考生的作文能力，若要把评分严与评分宽的评分者区分开，评分者的能力就成了测量目标，也即测量目标就完全发生了转移。显然，测量目标不同时，标志测量目标的分数也就不同。测量目标在具体关系条件下的分数叫全域分数。这样，有时对同一批测量资料来说，当测量工作的具体关系变化时全域分数也会变。即同一测验资料就可能有多种全域分数。

概化理论把全域分数方差对总变差的比称为为概括力系数（简称G系数）。而总方差可以分成全域分数方差(δ2 (p)和误差分数方差(δ2(δ))，如果测验是常模参照性测验，则G系数E2ρ是评价测验稳定性程度的最佳指标:

免责声明

隐私政策

用户协议

目录 22

0{{catalogNumber[index]}}. {{item.title}}