外れ値検定の分析のオプションを選択する

統計 > 基本統計 > 外れ値検定 > オプション

検定を指定する、有意水準を指定する、および対立仮説を選択します。

外れ値検定

Minitabのすべての外れ値検定は、サンプルに含まれる1つの外れ値を検出するように設計されています。通常、Grubbsの検定が適切です。ただし、サンプルに外れ値の可能性がある値が複数含まれている場合、Grubbsの検定とDixonのQ比はあまり効果的でないおそれがあります。

データで複数の外れ値検定を実行しないでください。外れ値検定を実行し、検定で識別された外れ値を除外してからもう1回外れ値検定を実行すると、実際には外れ値ではない値を除外するリスクがあります。このリスクを回避するには、自分の状況に最も合った種類の外れ値検定を選択します。
  • データに外れ値が含まれるかどうかわからない場合、Grubbsの検定を使用します。
  • データに1つ以上の外れ値が含まれることがわかっている場合、Dixonの検定の1つを使用します。Dixonの検定は、外れ値の可能性がある値が複数ある場合に引き起こされるおそれのある遮へい効果を防ぐように設計されています。

次の図で、各列は異なるDixonの比検定で同じサンプルをどのように処理するかを示しています。円で囲まれた値は、外れ値の可能性がある値です。Xは、それぞれのDixonの比検定で検定統計量を計算するときに無視するデータ値を示しています(この図では、対立仮説が最小または最大のデータ値が外れ値または最大のデータ値が外れ値であることを前提としています)。このデータでは、Dixonのr22比検定が円で囲まれた値を外れ値として識別する可能性が最も高くなっています。

正規母集団のサンプルが大きいほど、極端な値が含まれる可能性が高くなります。Dixonは、比について次の一般的なガイドラインを提案しました。

サンプルサイズ(n) 推奨比
r10(DixonのQ比とも呼ばれる)
r11
r21
r22

有意水準

有意水準をp値と比較して、帰無仮説(H0)を棄却するか、または棄却しないかを決定します。p値が有意水準より小さい場合、通常結果は統計的に有意と解釈され、H0が棄却されます。

通常は、有意水準(αまたはアルファとも呼ばれる)として0.05が適切です。有意水準が0.05の場合は、実際には差がないのに差が存在すると結論付けるリスクが5%あることを示します。
  • 存在する可能性がある差がより確実に検出されるようにするには、0.10などの高い値の有意水準を選択します。たとえば、品質エンジニアが新しいボールベアリングの安定性を現行のベアリングの安定性と比較するとします。ボールベアリングが不安定だと大事故が発生する可能性があるため、エンジニアは、新しいボールベアリングの安定性について強い確信を持っている必要があります。この場合エンジニアは、ボールベアリングの安定性における潜在的な差がすべて確実に検出されるよう、有意水準として0.10を選択します。
  • 実際に存在する差のみが確実に検出されるようにするには、0.01などの低い値の有意水準を選択します。たとえば、製薬会社の科学者は、会社の新薬によって症状が著しく緩和されるという主張について、非常に強い確信を持っている必要があります。この場合科学者は、症状における有意差が確かに存在することを示すため、有意水準として0.001を選択します。

何を判定しますか? (対立仮説)

何を判定しますか? (対立仮説)から、次の対立仮説検定のいずれかを選択します。
  • 最小または最大のデータ値が外れ値: 最小のデータ値または最大のデータ値が外れ値である可能性がある場合は、この両側検定を使用します。この両側検定により最小または最大のデータ値の外れ値は検出できますが、検出力は片側検定より低くなります。
  • 最小のデータ値が外れ値: この片側検定は最小のデータ値が外れ値であると疑われる場合に使用します。この片側検定の検出力は両側検定よりも高いですが、最大のデータ値である外れ値は検出できません。
  • 最大のデータ値が外れ値: この片側検定は最大のデータ値が外れ値であると疑われる場合に使用します。この片側検定の検出力は両側検定よりも高いですが、最小のデータ値である外れ値は検出できません。