更新时间:2023-01-06 10:21
广义线性模型[generalize linear model]线性模型的扩展,通过联结函数建立响应变量的数学期望值与线性组合的预测变量之间的关系。其特点是不强行改变数据的自然度量,数据可以具有非线性和非恒定方差结构。是线性模型在研究响应值的非正态分布以及非线性模型简洁直接的线性转化时的一种发展。
假设因变量 是 n 个独立观测,服从指数型分布,即其有密度函数:
其中 和 为参数, 和 为函数。
假设 为对应于的 p 维自变量 X 的观测值。记,其中 为 未知参数向量。假设 并且 与 具有关系
称如此定义的模型为广义线性模型, 称为自然参数, 称为离散参数,称 为联系函数(连接函数)。
联系函数确定了广义线性模型的均值结构,对于不同的数据类型,不同的联系函数的选取就产生了不同的广义线性模型。比如,对0-1变量数据,即实验结果只有两种情况。将全部试验数据分成 n 个组,第 i 组有 个数据.它们对应的自变量都为 在这个数据中,假设对应的因变量取值为 1 的数据个数为 假设 相互独立,并记因变量取1的概率为 .如果 与 具有如下关系其中 为标准正态分布函数,则称该广义线性模型为概率单位模型(probit model)。
如果联系函数为 ,且满足
则称该广义线性模型为对数单位模型(logit model)。再如,对计数数据(比如,在一定时间内某随机事件发生的次数),如果假设观测数据服从泊松分布.即
则当联系函数满足
称如此定义的广义线性模型为对数线性模型(logit linear model);当联系函数满足
称如此定义的广义线性模型为线性泊松模型 (linear Poisson model) 。