Logistic分布

更新时间：2023-05-14 20:45

Logistic分布指当n趋向于无穷大时，从指数分布(exponential distribution)中抽取的容量n的随机样本的最大与最小样本值的平均的极限分布。密度函数为：f(x)=exp[-(x-α)/β]/β{1+exp[-(x-α)/β]}2，-∞0，分布函数为：1/f(x)=exp[-(x-α)/β]。位置参数α为均值。分布的方差为π2β2/3，它的偏斜度为0，峰度为4.2。α=o，β=1时为标准logistic分布(standard logistic distribution)，它的累积概率分布函数(cumulative distribution function)F(x)与概率分布f(x)之间满足：f(x)=F(x)[1-F(x)]。

基本介绍

定义一

如果一个随机变量，它的分布函数为

则称服从logistic分布，这个分布函数叫做logistic函数，其图形见图1，此曲线叫做logistic曲线。其密度函数为

由图可见的期望值，密度函数对对称。分布函数F(x)在处等于005。(0，0，5)为曲线F(x)的对称点，而F(x)=0及F(x)=1为其渐近线。在(0，0，5)点处F(x)的斜率m=0.25。这是logistic函数的最简单的形式。

定义二

Logistic分布函数为

的分布称为Logistic分布。

其中。

式也可写成

它的密度函数为

式还告诉我们，Logistic分布仍然是属于位置-尺度参数族，其中是位置参数。是尺度参数，这样凡与位置-尺度参数族有关的结果，均对Logistic分布有效。当时，相应的分布称为标准Logistic分布，它的分布函数与分布密度为

很明显，如考虑

则也是一个分布函数，且有关系式

因此有时上也从出发，以它作为标准分布，经随机变量线性变换后导出的分布作为一般的Logistic分布。

一元logistic函数

一般地，一元logistic函数可表为

式中为二常值参数，随取值不同，分布的期望值，以及对称点，及对称点处的斜率取值也不同，从而可形成一些不同的S形曲线；因此可依式(2)拟合某些S形曲线。不过此式中y的值域总是区间(0，1)，且以y=0及y=1为其渐近线。

多元logistic函数

更一般的logistic函数为多元的(设为m元)

其中皆为m+1维向量，为参数向量，，到则分别为变量所可取的值，这些变量可以是连续的也可以是离散的。这个函数在不同条件下，或经不同的变换，可应用于不同的统计分析问题。

在研究来自同一总体的两个变量(设为X和Y)间的关系时，采得容量为n的样本。画出这组数据的散点图，如曲线接近S形，可试用logistic曲线去拟合它。

Logistic回归模型

模型概念

Logistic回归模型是分析二分类型变量时常用的非线性统计模型，是最重要且应用最广泛的非线性模型之一。该模型的因变量为二分类变量(y=0或y=1)，结果变量与自变量间是非线性关系。形式如方程(1)：

指事件发生的概率，取0～1。

模型优缺点

优点：

第一，对变量要求低，可以接受非正态分布的数据；

第二，总体预测准确率较高；

第三，数据来源直接，操作简便；

第四，判断标准明确；

第五，模型稳定，利于推广创新。

缺点：

第一，大多数时候对ST企业预测准确率较低；

第二，P值临界点的选择影响模型预测结果；

第三，违约样本与正常样本的比例影响预测结果。

模型原理

模型构造的原理简单来说是运用对数运算将事件发生与否(即事件发生概率或1)与自变量x间的非线性关系转化为线性关系。以单一自变量为例，具体转化步骤如下：

第一步，将上述Logistic模型方程(1)转化为如下一个非线性方程(2)。

第二步，方程(2)化简转化为如下方程(3)。

第三步，方程(3)等式两边同时取对数转化为如下方程(4)。

模型(4)得出与x间的线性关系方程。

此时，与虽然不存在线性关系，但是关于P的函数记作logistic(Pi)与存在线性关系。同理，自变量可拓展为m个，则有如下模型方程(5)。

以上得到的模型同样可以用来预测事件的发生。预测时根据已知自变量与模型方程得出，可以进一步计算事件发生的概率P。P处于0与1之间，越接近1表示发生的概率越大。

模型基本假设

第一，数据必须来自随机样本；

第二，为m个自变量的函数；

第三，或1；

第四，自变量不需要呈正态分布。

模型应用步骤

第一步，选取样本、确定初始指标；

第二步，筛选指标；

运用SPSS软件对所有指标进行Kolmogorov-Smirnov正态分布检验。符合正态分布的指标进行显著性T检验，不符合正态分布的数据进行Mann-Whitney显著性检验，去除不显著指标。进行Pearson检验，去除与其他指标存在高度相关性的指标。进行多重共线性检验，去除与其他指标存在多重共线性的指标；

第三步，进行KMO检验，确定是否进行因子分析；

第四步，进行Logistic回归，得到模型，观察模型拟合程度及预测准确率；

第五步，用检验样本检验模型预测能力；

第六步，利用模型预测事件的发生概率。

模型参数解释

当参数b大于0时，自变量x增大，减小，增大；

当参数b小于0时，自变量x增大，增大，减小；

当参数b等于0时，自变量x增加对无影响，不变。

因此，模型参量系数可以反映自变量x与事件发生概率P的关系。系数为正表明自变量x的增长促进事件的发生，系数为负表明自变量x的增长抑制事件的发生。

免责声明

隐私政策

用户协议

目录 22

0{{catalogNumber[index]}}. {{item.title}}