使用逆累积分布函数 (ICDF)

逆累积分布函数给出与特定累积概率关联的值。使用逆CDF来确定与特定概率相关的变量值。

使用 ICDF 确定保修期的示例

例如,一家电器制造商要调查其烤箱内加热管的失效时间。他们想要确定特定百分比的加热管失效的时间,以便设定保修期限。加热管的失效时间服从正态分布,其均值为 1000 小时,标准差为 300 小时。概率密度函数 (PDF) 可帮助确定较高和较低失效概率的范围。逆累积分布函数给出每个累积概率的对应失效时间。

使用逆累积分布函数估计 5% 的加热管失效所需的时间,95% 的加热管开始失效以及全部失效所需的时间,或仅剩 5% 加热管未失效的时间。特定累积概率的逆累积分布函数等于概率密度函数曲线下阴影区域右侧的失效时间。

确定 5% 的加热管失效所需的时间

  1. 选择 计算 > 概率分布 > 正态
  2. 选择逆累积概率。在均值中,输入 1000。在标准差中,输入 300。在输入常量中,输入 0.05
  3. 单击 确定

5% 的加热管失效所需的时间预计为 0.05 倍的逆累积分布函数或 506.544 小时。

此图说明逆累积分布函数。

确定 95% 的加热管失效所需的时间

  1. 选择 计算 > 概率分布 > 正态
  2. 选择逆累积概率。在均值中,输入 1000。在标准差中,输入 300。在输入常量中,输入 0.025。单击 确定

    2.5% 的加热管失效所需的时间预计为 0.025 倍的逆累积分布函数或 412 小时。

  3. 重复步骤 2,但输入 0.975 而非 0.025。单击 确定
    97.5% 的加热管失效所需的时间预计为 0.975 倍的逆累积分布函数或 1588 小时。

因此,95% 的加热管开始失效和全部失效所需的时间预计分别为 0.025 倍和 0.975 倍的逆累积分布函数或 412 小时和 1588 小时。

此图说明逆累积分布函数。

确定 5% 的加热管未失效的时间

  1. 选择 计算 > 概率分布 > 正态
  2. 选择逆累积概率。在均值中,输入 1000。在标准差中,输入 300。在输入常量中,输入 0.95
  3. 单击 确定

仅剩 5% 的加热管未失效的时间预计为 .95 倍的逆累积分布函数或 1493 小时。

此图说明逆累积分布函数。

将 CDF 和 ICDF 与超几何分布结合使用的示例

在尝试确定离散分布的逆累积概率时,输出结果中将包含两组列。

假设你有一个比例的倒累积概率 p。输出中的第一组列列出了最大的x,使得P(X ≤ x) ≤ p。第二组列列出最小的x,使得P(X ≤ x) ≥ p。

计算超几何分布的累积概率

  1. 在工作表的 C1 列中,输入 0 1 2
    C1
     
    0
    1
    2
  2. 选择 计算 > 概率分布 > 超几何
  3. 选择累积概率
  4. 总体大小 (N)中,类型 为20000
  5. 总体中的事件计数 (M)中,类型 为2000
  6. 样本数量 (n)中,类型 为20
  7. 选择 输入列 并输入 C1。单击 确定
将出现此输出:

累积分布函数

超几何分布,N = 20000、M = 2000 以及 n = 20 x P( X ≤ x ) 0 0.121448 1 0.391619 2 0.676941
可以按如下方式解释输出内容:
  • P(X ≤ 0) = 0.121448。获得 0 个缺陷的概率大约为 12%。
  • P(X ≤ 1) = 0.391619。获得 0 或 1 个缺陷的概率大约为 39%。
  • P(X ≤ 2) = 0.676941。获得 0、1 或 2 个缺陷的概率大约为 68%。

计算超几何分布的逆累积概率

现在,您知道了与缺陷数相关联的累积概率,可以计算逆累积概率了。

假设您要计算缺陷数 x,使累积概率 p 为 0.50。通过前面的结果了解到,P(X ≤ 1 ) = 0.391619 并且 P(X ≤ 2 ) = 0.676941。由于超几何分布是离散分布,缺陷数不能介于1到2之间。换句话说,你可能有1个或2个缺陷,但不是1.4个缺陷。因此,如果你选择 输入常量 并输入 0.50,Minitab会在输出中计算两个概率,如下例所示:

  1. 选择 计算 > 概率分布 > 超几何
  2. 选择逆累积概率
  3. 总体大小 (N)中,类型 为20000
  4. 总体中的事件计数 (M)中,类型 为2000
  5. 样本数量 (n)中,类型 为20
  6. 选择 输入常量,输入 0.50。单击 确定
将出现此输出:

逆累积分布函数

超几何分布,N = 20000、M = 2000 以及 n = 20 x P( X ≤ x ) x P( X ≤ x ) 1 0.391619 2 0.676941

第一个概率表示x的值,使得P(X ≤ x) < p and the second probability indicates the smallest x such that P(X ≤ x) ≥ p. In this example, the first probability shows the largest number of defectives, x = 2, such that P(X ≤ 2) <0.5 and the 2nd 显示的缺陷最少数量x = 3,使得P(X ≤ 3) ≥0.5。

使用 ICDF 计算临界值

可以使用 Minitab 计算一个假设检验的临界值,而不用在表格中查找该值。

假设你进行一个卡方检验,α = 0.02,自由度为12。对应的临界值是多少?α = 0.02 所对应累积概率值为 1 – 0.02 = 0.98。

  1. 选择 计算 > 概率分布 > 卡方
  2. 选择逆累积概率
  3. 自由度中,输入 12
  4. 选择 输入常量 并输入 0.98
  5. 单击 确定

Minitab 显示临界值 24.054。对于卡方检验,如果检验统计量大于临界值,你可以得出有统计证据否定原假设的结论。

注意

此示例使用卡方分布。但是,您可以为所选择的任何分布执行相同的步骤。