更新时间:2022-08-25 15:22
重尾分布(Heavy-tailed distribution)是一种概率分布模型,它的尾部比指数分布还要厚。在许多情况下,右边尾部的部分比较受到重视,但左边尾部比较厚,或是两边尾部都比较厚的状况,也被认为是一种重尾分布。
重尾分布又可以分为两个子类型,分别是长尾分布(long-tailed distributions)以及次指数分布(subexponential distributions)。
在一个累积分布函数中,一个随机变量X 的分布状况,在以下状况时,被称为是一个重尾分布。假设:
如果以尾部分布函数的方式来呈现时,
最后可以被写成:
这相当于一个动差生成函数, ,对所有的t>0 来说,都是无限的。重尾分布的左尾,与双尾分布,定义相同。
一般来说,服从重尾分布的随机变量X具有较大甚至是无穷大的方差,而且当 时,X的均值也是无穷的。随机变量X会以不可忽略的概率取到非常大的数值,即:大量的小抽样取值和少量的大抽样取值并存。
这相等于
对一个右尾部形成长尾分布的状况,我们可以做一个直观的解释:假如一个长尾分布的尾部数量超过某个很高的水准,它超过另一个更高水准的机率会接近于一。也就是说,如果你发现状况很糟,它可能会比你想像的还要糟。
长尾分布是重尾分布中的一个特例。所有的长尾分布都是重尾分布,但反之则不然,也就是说,我们可以找出某一个重尾分布,它不是长尾分布。
次指数分布是以概率分布的折积定义出来的。两个独立、不同的随机变数的共同分布函数 ,它自己的折积定义为,使用勒贝格-史台杰斯积分(Lebesgue–Stieltjes integration) 定义为:
n-fold折积的 也以同样方式定义。其尾端分布函数定义为{。
当以下式子成立,概率分布函数在正的中线上,被定义为次指数分布:
这也意味着,对所有来说: