更新时间:2022-09-23 09:57
对于给定的统计推断问题,包含了原样本中关于该问题的全部有用信息的统计量。对于未知参数的估计问题,保留了原始样本中关于未知参数θ的全部信息的统计量,就是充分统计量。如样本均值X是总体数学期望的充分统计量。数学上,设(X1, …,Xe)是来自总体X的一个随机样本,T=T(X1, …,Xe)是一统计量。若在T=t的条件下,样本的条件分布与未知参数θ无关,则称统计量T是θ的充分统计量。
样本中包含关于总体的信息可分为两部分:其一是关于总体结构的信息,即反映总体分布的结构;其二是关于总体中未知参数的信息,这是由于样本的分布中包含了总体分布中的未知信息。我们对信息的加工只会减少,不会增多,即统计量具有压缩数据功能,但会凸显我们需要的信息。那么一个好的统计量应该能将样本中包含未知参数的全部信息提取出来,即样本加工不损失未知参数的信息称为充分性。如何将这一想法用数学形式表示呢?费希尔在1922年提出了一个重要概念——充分统计量计量。粗略地说,充分统计量就是不损失信息的统计量,在简化统计问题中是非常重要的概念,也是经典统计和贝叶斯统计中为数不多的相一致的观点之一。
在经典统计中充分统计量是这样定义的:
设 是来自分布函数 的样本 是一个统计量,如果在给定 的条件下,x的分布与 无关,则称统计量 为 的充分统计量。
在一般情况下,用上述定义直接验证一个统计量是困难的,因为需要计算条件分布,幸好有一个判断充分统计量的充要条件——因子分解定理。
一个统计量 是参数 的充分统计量,其充分必要条件是存在一个t与 的函数和一个样本的函数 ,使得对于任何一个样本x和任意的 ,样本的联合密度函数 可以表示为它们的乘积,即
由于样本的联合密度函数 ,就是似然估计函数 ,所以也可以把上述定理的相应部分改成
设 是来自密度函数 的样本, 是一个统计量,它的密度函数为 ,又设 是参数 的某个先验分布族,则统计量 是参数 的充分统计量的充分必要条件是,对任意一个先验分布 ,有
即用样本分布 算得的后验分布与用充分统计量 算得的后验分布是相同的。
1.定理给出的条件是充分必要的,因此定理的充分必要条件可以作为充分统计量的贝叶斯定义。
2.如果已知统计量 是充分统计量,那么根据定理,其后验分布可用该统计量的分布算得,由于充分统计量可以简化数据、降低维数,因此定理也可以简化后验分布的计算。
设 是来自正态分布 的样本,由于 是 的充分统计量,若 的先验分布取正态分布 ,其中 为已知,那么 的后验分布可用充分统计量 的分布算得,即
因此后验分布是正态分布。