指数分布

可使用指数分布对连续 Poisson 过程中的两个事件之间的时间进行建模。假设独立事件以恒定速率发生。

此分布应用广泛(包括产品和系统的可靠性分析、排队理论以及马尔可夫链)。

例如,指数分布可用于对以下内容进行建模:
  • 电气组件的失效时间
  • 客户到达终端的间隔时间
  • 客户排队等待的服务时间
  • 拖欠付款的时间(信用风险建模)
  • 放射性核衰变的时间
双参数指数分布由其尺度和阈值参数定义。如果阈值参数 θ 为正数,则将分布向右偏移距离 θ。例如,您对研究 θ = 5 的系统失效非常感兴趣。这意味着仅在操作 5 小时后才开始出现失效,之前不会出现失效。在下面的图形中,阈值参数 θ 等于 5,将分布向右偏移 5 个单位。

对于 1 参数指数分布,阈值为零,且分布由其尺度参数定义。对于 1 参数指数分布,尺度参数等于均值。

无记忆的含义是什么?

指数分布的重要属性为它是无记忆的。事件的发生机会不依赖于过去的试验。因此,发生率保持不变。

该无记忆属性指示元件的剩余寿命与其当前使用年限无关。例如,抛硬币的随机试验体现了无记忆属性。经过磨损并在使用年限后期更容易失效的系统便不是无记忆的。

Gamma 分布

使用 Gamma 分布可以对向右偏斜且大于 0 的正数据值进行建模。例如,Gamma 分布可以描述电气组件失效的时间。特定类型的大多数电气组件几乎同时失效,但是少数组件很长时间后才会失效。

Gamma 分布是由其形状和尺度参数定义的连续分布。3 参数 Gamma 分布由其形状、尺度和阈值参数定义。例如,在下面的图形中,Gamma 分布由不同的形状和尺度值定义(当阈值设置为 0.0 时)。请注意,Gamma 分布中的大多数值彼此接近,但一些值进入上尾中。

当形状参数为整数时,Gamma 分布有时称为 Erlang 分布。Erlang 分布通常用于排队理论应用中。

Logistic 分布

使用 Logistic 分布可对与正态分布相比尾部更长且峰度更高的数据分布进行建模。

Logistic 分布是由其位置和尺度参数定义的连续分布。Logistic 分布没有形状参数,也就是说其概率密度函数只有一个形状。Logistic 分布的形状与正态分布的形状相似。但是,Logistic 分布的尾部更长。
尺度参数的效应
下图显示了 Logistic 分布上不同尺度参数值的效应。
位置参数的效应
下图显示了 Logistic 分布上不同位置参数值的效应。

对数 Logistic 分布

当变量的对数呈对数 Logistic 分布时,可使用对数 Logistic 分布。例如,对数 Logistic 分布可用于生长模型中,以及用于对生物统计和经济等领域中的二元响应建模。

对数 Logistic 分布是由其位置和尺度参数定义的连续分布。3 参数对数 Logistic 分布由其尺度、位置和阈值参数定义。

下图显示了一个对数 Logistic 分布,其具有以下参数:尺度=1.0,位置=.0,阈值=.0。

对数 Logistic 分布也称为 Fisk 分布。

对数正态分布

如果随机变量的对数是正态分布的,请使用对数正态分布。当随机变量大于 0 时使用。例如,对数正态分布用于可靠性分析和股票行为建模等金融应用中。

对数正态分布是由其位置和尺度参数定义的连续分布。3 参数对数正态分布由其位置、尺度和阈值参数定义。

对数正态分布的形状与对数 Logistic 分布和 Weibull 分布的形状类似。例如,下图显示了一个对数正态分布,其具有以下参数:尺度=1.0,位置=.0,阈值=.0。

正态分布

正态分布是由均值 (μ) 和标准差 (σ) 指定的连续分布。均值是钟形曲线的波峰或中心。标准差决定分布的散布情况。

例如,在下面的正态分布图形中,大约有 68% 的观测值与均值相差不到 +/- 1 个标准差;95% 与均值相差不到 +/- 2 个标准差(如阴影区域所示);而 99.7% 的观测值与均值相差不到 +/- 3 个标准差。

正态分布是最常见的统计分布,因为许多物理、生物和社会方面的测量值都自然近似于正态。许多统计分析均假定数据来自近似正态分布的总体。

最小和最大极值分布

最大极值分布和最小极值分布紧密相关。例如,如果 X 具有最大极值分布,则 −X 具有最小极值分布,反之亦然。

最小极值分布

最小极值分布由其位置和尺度参数定义。使用最小极值分布可对随机观测值分布中的最小值进行建模。通常,最小极值分布用于为在其最弱的组件出现故障时即失效的系统的失效时间进行建模。最小极值分布描述如最低温度、干旱期间的降雨量等极端现象。最小极值分布向左偏斜。例如,链条的断裂强度分布通常向左偏斜,这是由于链条会在其最弱的链接断开时断开。此分布的左侧是少量弱样本,大部分强度在上尾中。

最大极值分布

最大极值分布由其位置和尺度参数定义。使用最大极值分布可对随机观测值分布中的最大值进行建模。最大极值分布描述如极端风速、大额保险赔偿等极端现象。最大极值分布向右偏斜。例如,河流中一段时间内的水位通常向右偏斜,右侧是少量极端水位,大部分水位在下尾中。

Weibull 分布

Weibull 分布是一个多功能分布,可用来对工程制造、医学研究、质量控制、财务和气候领域中的广泛应用进行建模。例如,此分布常与可靠性分析一起用于对失效时间数据进行建模。Weibull 分布也用于对功能分析中的偏斜过程数据进行建模。

Weibull 分布由其形状、尺度和阈值参数描述,也称为 3 参数 Weibull 分布。阈值参数为零的情况称为 2 参数 Weibull 分布。只能为正变量定义 2 参数 Weibull 分布。3 参数 Weibull 分布可使用零和负数据,但 2 参数 Weibull 分布只能使用大于零的数据。

根据其参数的值,Weibull 分布可以具有各种形状。

形状参数的效应
形状参数描述数据的分布方式。形状 3 接近于正态曲线。较低的形状值(如 1)将给出右偏斜曲线。较高的形状值(如 10)将给出左偏斜曲线。
尺度参数的效应
尺度或特征寿命是数据的 63.2 百分位数。尺度定义 Weibull 曲线相对于阈值的位置,这与均值定义正态曲线位置的方式相类似。例如,尺度为 20 表示 63.2% 的设备将在阈值时间过后的前 20 小时内失效。
阈值参数的效应
阈值参数描述分布离 0 位置的偏移。负阈值使分布向左偏移,正阈值使分布向右偏移。所有数据必须大于阈值。2 参数 Weibull 分布与 3 参数 Weibull 分布相同,其阈值为 0。例如,3 参数 Weibull (3,100,50) 与 2 参数 Weibull (3,100) 具有相同的形状和散布情况,但它向右偏移 50 个单位。