逆累積分布関数(ICDF)とは

逆累積分布関数は、特定の累積確率に関連する値を計算します。逆累積分布関数を使用すると、特定の確率に関連する変数の値を得られます。

保証期間を決定する場合のICDFの使用例

たとえば、家電メーカーが自社製トースターの発熱体の故障時間を調べるとします。発熱体の各部分の故障時間を特定することで、保証期間を決めたいと考えています。発熱体の故障時間は、平均値1000時間で正規分布に従い、標準偏差は300時間でした。確率密度関数(PDF)の曲線は、故障の確率が高い領域と低い領域を特定するのに役立ちます。逆累積分布関数は、それぞれの累積確率に対応する故障時間を得ることができます。

逆累積分布関数を使用すると、発熱体のうち5%が故障するまでの時間、発熱体のうち95%が故障する期間の最初と最後、または発熱体のうち5%だけが正常に動作し続けている時間を推測できます。特定の累積確率に対する逆累積分布関数は、PDF曲線の右側の陰影の付いた領域で示された故障時間と同じです。

5%が故障するまでの時間を調べる

  1. 計算 > 確率分布 > 正規を選択します。
  2. 逆累積確率を選択します。平均に、「1000」と入力します。標準偏差に、「300」と入力します。定数で入力に、「0.05」と入力します。
  3. OKをクリックします。

発熱体の5%が故障すると考えられる時間は、逆累積分布関数で確率0.05または506.544時間です。

このプロットでは逆累積分布関数が示されています。

95%が故障する間隔を調べる

  1. 計算 > 確率分布 > 正規を選択します。
  2. 逆累積確率を選択します。平均に、「1000」と入力します。標準偏差に、「300」と入力します。定数で入力に、「0.025」と入力します。OKをクリックします。

    発熱体の2.5%が故障すると考えられる時間は、逆累積分布関数で確率0.025または412時間です。

  3. ステップ2に戻り、「0.025」の代わりに「0.975」と入力します。OKをクリックします。
    発熱体の97.5%が故障すると考えられる時間は、逆累積分布関数で確率0.975または1588時間です。

このため、発熱体の95%が故障すると考えられる間隔は、逆累積分布関数で確率0.025~0.975、または412時間~1588時間です。

このプロットでは逆累積分布関数が示されています。

5%が正常に動作し続ける時間を調べる

  1. 計算 > 確率分布 > 正規を選択します。
  2. 逆累積確率を選択します。平均に、「1000」と入力します。標準偏差に、「300」と入力します。定数で入力に、「0.95」と入力します。
  3. OKをクリックします。

発熱体の5%が正常に動作していると考えられる時間は、逆累積分布関数で確率0.95または1493時間です。

このプロットでは逆累積分布関数が示されています。

超幾何分布でのCDFとICDFの使用例

離散型分布の逆累積確率を求める場合、出力には2つの列セットが含まれます。

比率の逆累積確率pがあるとします。出力に含まれる最初の列セットは、P(X ≤ x) ≤ pの場合の最大xのリストです。2番目の列セットは、P(X ≤ x) ≥ pの場合の最小xのリストです。

超幾何分布の累積確率を計算する

  1. ワークシートの列C1に「0 1 2」と入力します。
    C1
    0
    1
    2
  2. 計算 > 確率分布 > 超幾何を選択します。
  3. 累積確率を選択します。
  4. 母集団サイズ (N)に、20000を入力します。
  5. 母集団での事象度数 (M)に、2000を入力します。
  6. サンプルサイズ (n)に、20を入力します。
  7. 列から入力を選択し、「C1」と入力します。OKをクリックします。
この出力は以下のように表示されます。

累積分布関数

N=20000、M=2000、およびn=20である超幾何 x P( X ≤ x ) 0 0.121448 1 0.391619 2 0.676941
この出力は次のように解釈できます。
  • P(X ≤ 0) = 0.121448。欠陥数が0の確率は約12%です。
  • P(X ≤ 1) = 0.391619。欠陥数が0または1の確率は約39%です。
  • P(X ≤ 2) = 0.676941。欠陥数が0、1、または2の確率は約68%です。

超幾何分布の逆累積確率を計算する

欠陥数に関する累積確率が判明したため、逆累積確率を計算します。

累積確率pが0.50の場合の欠陥数xを計算するとします。以前の結果から、P(X ≤ 1 ) = 0.391619、P(X ≤ 2 ) = 0.676941であることがわかっています。超幾何分布は離散型分布であるため、欠陥数が1と2の間になることはありません。つまり、1または2の欠陥数はあり得ますが、欠陥数が1.4になることはありません。したがって、定数で入力を選択して「0.50」と入力すると、次の例に示すように出力で両方の確率が計算されます。

  1. 計算 > 確率分布 > 超幾何を選択します。
  2. 逆累積確率を選択します。
  3. 母集団サイズ (N)に、20000を入力します。
  4. 母集団での事象度数 (M)に、2000を入力します。
  5. サンプルサイズ (n)に、20を入力します。
  6. 定数で入力でを選択し、0.50を入力します。OKをクリックします。
この出力は以下のように表示されます。

逆累積分布関数

N=20000、M=2000、およびn=20である超幾何 x P( X ≤ x ) x P( X ≤ x ) 1 0.391619 2 0.676941

最初の確率はP(X ≤ x) < pの場合のxの値を示し、2番目の確率はP(X ≤ x) ≥ pの場合の最小xを示します。この例では、最初の確率はP(X ≤ 2) < 0.5の場合の最大欠陥数x = 2表し、2番目の確率はP(X ≤ 3) ≥ 0.5の場合の最小欠陥数x = 3を表しています。

ICDFを使用して棄却値を計算する

表を調べる代わりに、Minitabを使用して仮説検定の棄却値を計算することができます。

α=0.02で自由度が12のカイ二乗検定を実行するとします。ここでは、これに対応する棄却値を計算します。α=0.02ということは、累積確率値が1-0.02=0.98となります。

  1. 計算 > 確率分布 > カイ二乗を選択します。
  2. 逆累積確率を選択します。
  3. 自由度に、「12」と入力します。
  4. 定数で入力を選択し、0.98と入力します。
  5. OKをクリックします。

Minitabに棄却値24.054が表示されています。カイ二乗検定では、検定統計量が棄却値より大きい場合に、帰無仮説を棄却する統計的証拠があるという結論を下すことができます。

この例ではカイ二乗分布を使用しています。ただし、選択した分布で同じ手順に従います。