更新时间:2023-07-09 11:58
层次贝叶斯模型是一个统计模型,用来为具有不同水平的问题进行建模,通过贝叶斯方法估计后验分布的参数。
我们对层次贝叶斯推断的策略与一般的多参数问题一样,但由于在实际中层次模型的参数很多,所以比较困难。在实际中,我们很难画出联合后验概率分布的图形。但是,我们可以使用近似的基于仿真的方法。运用层次贝叶斯模型主要需要计算所有参数在已知观测量下的条件后验概率,其推导过程主要包含三个步骤:
很多统计模型都有多个参数,这些参数也可以通过某种方式变成具有结构的问题,意味着这些参数的联合概率模型应当反应出它们之间的依赖关系。举个例子说,在研究心脏病治疗效果的时候,医院 j 的病人的存活率为θj,那么我们估计θj应当是相互联系的。我们可以看到使用先验分布,把θj当作一个总体分布的样本是很自然的事情。这样的应用有一个很关键的点是,观测数据,yij,其中 i 表示组的索引,j 表示单元的索引,可以用来估计θj的总体分布,即便θj并不是观测的。这样的问题使用层次模型是很自然的事情,其中观测的结果是在某些参数下的条件模型,这些参数称为超参数。这样的层次模型可以帮助我们理解多参数问题,并且在寻找计算策略时提供重要帮助。
实际中,简单的非层次模型可能并不适合层次数据:在很少的参数情况下,它们并不能准确适配大规模数据集,然而,过多的参数则可能导致过拟合的问题。相反,层次模型有足够的参数来拟合数据,同时使用总体分布将参数的依赖结构化,从而避免过拟合问题。