什么是逆累积分布函数 (ICDF)?

逆累积分布函数给出与特定累积概率关联的值。可使用逆 CDF 确定与特定概率相关联的值。

使用 ICDF 确定保修期的示例

例如,一家电器制造商要调查其烤箱内加热管的失效时间。他们想要确定特定百分比的加热管失效之前的时间,以便设定保修期限。加热管的失效时间服从正态分布,其均值为 1000 小时,标准差为 300 小时。概率密度函数 (PDF) 可帮助确定较高和较低失效概率的范围。逆 CDF 给出每个累积概率的对应失效时间。

使用逆 CDF 估计 5% 的加热管失效所需的时间,95% 的加热管开始失效以及全部失效所需的时间,或仅剩 5% 加热管未失效的时间。特定累积概率的逆 CDF 等于概率密度函数曲线下阴影区域右侧的失效时间。

确定 5% 的加热管失效所需的时间

  1. 选择计算 > 概率分布 > 正态
  2. 选择逆累积概率。在均值中,输入 1000。在标准差中,输入 300。在输入常量中,输入 0.05
  3. 单击确定

5% 的加热管失效之前的时间预计为 0.05 倍的逆 CDF,或为 506.544 小时。

此图演示了逆 CDF。

Determine times between which 95% will fail

  1. 选择计算 > 概率分布 > 正态
  2. 选择逆累积概率。在均值中,输入 1000。在标准差中,输入 300。在输入常量中,输入 0.025。单击 确定

    2.5% 的加热管失效之前的时间预计为 0.025 倍的逆 CDF,或为 412 小时。

  3. 重复步骤 2,但输入 0.975 而非 0.025。单击 确定
    97.5% 的加热管失效之前的时间预计为 0.975 倍的逆 CDF,或为 1588 小时。

因此,95% 的加热管开始失效和全部失效所需的时间预计分别为 0.025 倍和 0.975 倍的逆 CDF,或为 412 小时和 1588 小时。

此图演示了逆 CDF。

确定 5% 的加热管未失效的时间

  1. 选择计算 > 概率分布 > 正态
  2. 选择逆累积概率。在均值中,输入 1000。在标准差中,输入 300。在输入常量中,输入 0.95
  3. 单击确定

仅剩 5% 的加热管未失效的时间预计为 0.95 倍的逆 CDF,或为 1493 小时。

此图演示了逆 CDF。

关于将 CDF 和 ICDF 与超几何分布结合使用的示例

在尝试确定离散分布的逆累积概率时,输出结果中将包含两组列。

假设您具有比例 p 的逆累积概率。输出的第一组列中列出了满足 P(X ≤ x) ≤ p 条件的最大 x。第二组列中列出了满足 P(X ≤ x) ≥ p 条件的最小 x。

计算超几何分布的累积概率

  1. 在工作表的 C1 列中,输入 0 1 2
    C1
    0
    1
    2
  2. 选择计算 > 概率分布 > 超几何
  3. 选择累积概率
  4. 总体大小 (N)中,输入20000
  5. 总体中的事件计数 (M)中,输入2000
  6. 样本数量 (n)中,输入20
  7. 选择输入列并输入 C1。单击 确定
“会话”窗口中将显示如下输出:

累积分布函数

超几何分布,N = 20000、M = 2000 以及 n = 20 x P( X ≤ x ) 0 0.121448 1 0.391619 2 0.676941
可以按如下方式解释输出内容:
  • P(X ≤ 0) = 0.121448。得到 0 个缺陷的概率约为 12%。
  • P(X ≤ 1) = 0.391619。得到 0 个或 1 个缺陷的概率约为 39%。
  • P(X ≤ 2) = 0.676941。得到 0 个、1 个 或 2 个缺陷的概率约为 68%。

计算超几何分布的逆累积概率

现在,您知道了与缺陷数相关联的累积概率,可以计算逆累积概率了。

假设要计算缺陷的数量 x,以使累积概率 p 为 0.50。从前面的结果中,您已知道 P(X ≤ 1 ) = 0.391619 且 P(X ≤ 2 ) = 0.676941。因为超几何分布是离散分布,所以缺陷数量不能介于 1 和 2 之间。也就是说,您可有 1 个或 2 个缺陷,但不能有 1.4 个缺陷。因此,如果选择输入常量并输入 0.50,Minitab 将计算“会话”窗口输出中的两个概率,如下例所示:

  1. 选择计算 > 概率分布 > 超几何
  2. 选择逆累积概率
  3. 总体大小 (N)中,输入20000
  4. 总体中的事件计数 (M)中,输入2000
  5. 样本数量 (n)中,输入20
  6. 选择输入常量,并键入 0.50。单击 确定
“会话”窗口中将显示如下输出:

逆累积分布函数

超几何分布,N = 20000、M = 2000 以及 n = 20 x P( X ≤ x ) x P( X ≤ x ) 1 0.391619 2 0.676941

第一个概率指示满足 P(X ≤ x) < p 条件的 x 值,第二个概率指示满足 P(X ≤ x) ≥ p 条件的最小 x 值。在此示例中,第一个概率显示可满足 P(X ≤ 2) <0.5 条件的最大缺陷品数量 (x = 2),第二个概率显示可满足 P(X ≤ 3) ≥ 0.5 条件的最小缺陷品数量 (x = 3)。

使用 ICDF 计算临界值

可以使用 Minitab 计算一个假设检验的临界值,而不用在表格中查找该值。

假设您执行一个卡方检验(其 α = 0.02,并具有 12 个自由度)。对应的临界值是多少?α = 0.02 所对应累积概率值为 1 - 0.02 = 0.98。

  1. 选择计算 > 概率分布 > 卡方
  2. 选择逆累积概率
  3. 自由度中,输入 12
  4. 选择输入常量并输入 0.98
  5. 单击 确定

Minitab 在“会话”窗口中显示临界值 24.054。对于卡方检验,如果检验统计量大于临界值,则可以断定存在否定原假设的统计学证据。

注意

此示例使用的是卡方分布。但是,您可以为所选择的任何分布执行这些相同步骤。

使用此网站,即表示您同意对数据分析和个性化内容使用 Cookie。  请阅读我们的政策