有意水準(αまたはアルファで示される)とは、帰無仮説が正しいにもかかわらず帰無仮説を棄却するリスク(第1種の過誤)の最大許容水準です。デフォルト値は0.05です。
有意水準を使用して、帰無仮説(H0)を棄却するか棄却できないかを決定します。ある事象が発生する確率が有意水準より低い場合、通常は、結果が統計的に有意であり、H0を棄却できると解釈します。
サンプルサイズ(N)は、サンプルに含まれる観測値の総数です。
平均値は、データの平均であり、すべての観測値の和を観測値の数で割って求められる値です。
データの中心を表す1つの値でサンプルを表すのに、平均を使います。多くの統計分析では、平均がデータ分布の中央の標準測度として使用されます。
標準偏差とは、散布度、つまり平均を中心としたデータの広がり方を表す最も一般的な測度です。記号σ(シグマ)は、母集団の標準偏差を示す場合によく使用されますが、sはサンプルの標準偏差を示す場合にも使用されます。多くの場合、工程に対してランダム(自然)な変動は雑音と呼ばれます。
標準偏差の単位はデータの単位と同じであるため、通常は、分散よりも解釈が簡単です。
標準偏差を使用して、平均からのデータの拡散程度を判断します。 標準偏差の値が高いほど、データの広がりが大きいことを示します。 正規分布の経験則によれば、値のおよそ68%が平均の1つの標準偏差の範囲内にあり、値の95%が2つの標準偏差の範囲内にあり、値の99.7%が3つの標準偏差の範囲内にあります。
最大値とは、最大のデータ値を指します。
このデータで、最大値は19です。
13 | 17 | 18 | 19 | 12 | 10 | 7 | 9 | 14 |
最大値を使用して、外れ値の可能性がある値またはデータ入力ミスを識別します。データの広がりを最も簡単に評価する方法の1つは、最小値と最大値を比較することです。データの中心、広がり、形状を検討する場合であっても、最大値が非常に大きい場合、極端な値の原因を調査してください。
最小値とは、最小のデータ値を指します。
このデータで、最小値は7です。
13 | 17 | 18 | 19 | 12 | 10 | 7 | 9 | 14 |
最小値を使用して、外れ値の可能性がある値またはデータ入力ミスを識別します。データの広がりを最も簡単に評価する方法の1つは、最小値と最大値を比較することです。データの中心、広がり、形状を検討する場合であっても、最小値が非常に小さい場合、極端な値の原因を調査してください。
外れ値とは、異常に大きいまたは小さい観測値を指します。外れ値の原因を特定する必要があります。データ入力や測定の誤差を修正します。異常な1回きりの事象(特別原因)のデータ値は除外することを検討します。
外れ値が含まれるワークシートの行。この値は、外れ値が存在する場合のみ表示されます。
Dixonの比検定を使用する場合、Minitabでは検定表に最小値と最大値の他にいくつかの観測値が表示されます。角括弧で囲まれた値は、他の値に関連した観測値のサイズを示しています。たとえば、x[2]は2番目に小さい観測値であることを示し、x[N-1]は2番目に大きい観測値であることを示します。
Grubbsの検定統計量(G)とは、サンプル平均と最小または最大のデータ値の差を標準偏差で割ったものです。MinitabはGrubbsの検定統計量を使用してp値を計算します。p値とは、帰無仮説が真であるにもかかわらず帰無仮説を棄却する確率を指します。
p値は帰無仮説を棄却するための証拠を測定する確率です。p値が小さいほど、帰無仮説を棄却するための強力な証拠となります。
p値を使用して、外れ値が存在するかどうかを判断します。
外れ値プロットは個別値プロットに似ています。外れ値プロットを使用して、データ内の外れ値を視覚的に識別します。 外れ値が存在する場合は、プロットに赤い四角で表示されます。 外れ値の原因を特定する必要があります。データ入力や測定の誤差を修正します。異常な1回きりの事象(特別原因)のデータ値は除外することを検討します。