和とは、すべてのデータ値の合計です。和は、平均や標準偏差などの統計量計算にも使用されます。
平均値は、データの平均であり、すべての観測値の和を観測値の数で割って求められる値です。
データの中心を表す1つの値でサンプルを表すのに、平均を使います。多くの統計分析では、平均がデータ分布の中央の標準測度として使用されます。
標準偏差とは、散布度、つまり平均を中心としたデータの広がり方を表す最も一般的な測度です。記号σ(シグマ)は、母集団の標準偏差を示す場合によく使用されますが、sはサンプルの標準偏差を示す場合にも使用されます。多くの場合、工程に対してランダム(自然)な変動は雑音と呼ばれます。
標準偏差の単位はデータの単位と同じであるため、通常は、分散よりも解釈が簡単です。
標準偏差を使用して、平均からのデータの拡散程度を判断します。 標準偏差の値が高いほど、データの広がりが大きいことを示します。 正規分布の経験則によれば、値のおよそ68%が平均の1つの標準偏差の範囲内にあり、値の95%が2つの標準偏差の範囲内にあり、値の99.7%が3つの標準偏差の範囲内にあります。
最小値とは、最小のデータ値を指します。
このデータで、最小値は7です。
13 | 17 | 18 | 19 | 12 | 10 | 7 | 9 | 14 |
最小値を使用して、外れ値の可能性がある値またはデータ入力ミスを識別します。データの広がりを最も簡単に評価する方法の1つは、最小値と最大値を比較することです。データの中心、広がり、形状を検討する場合であっても、最小値が非常に小さい場合、極端な値の原因を調査してください。
最大値とは、最大のデータ値を指します。
このデータで、最大値は19です。
13 | 17 | 18 | 19 | 12 | 10 | 7 | 9 | 14 |
最大値を使用して、外れ値の可能性がある値またはデータ入力ミスを識別します。データの広がりを最も簡単に評価する方法の1つは、最小値と最大値を比較することです。データの中心、広がり、形状を検討する場合であっても、最大値が非常に大きい場合、極端な値の原因を調査してください。
範囲とは、サンプルの最も大きいデータ値と最も小さいデータ値の差です。範囲は、すべてのデータ値が含まれる区間を表します。
範囲を使用して、データの広がりを理解できます。範囲の値が大きい場合、データの広がりが大きいことを示します。範囲の値が小さい場合、データの広がりが小さいことを示します。範囲は2つのデータ値のみを使用して計算されるため、小さいデータセットを使用する場合に有用です。
中央値はデータセットの中間点です。この中間点の値は、観測値の半分がその値より上にあり、観測値の半分がその値より下にあるという点です。中央値は、観測値に順位付けし、順位付けされた順序での順位が[N + 1] / 2の観測値を検出することによって算定されます。観測値の数が偶数の場合、その中央値は、N / 2と[N / 2] + 1の順位で順位付けされる観測値の平均値です。
未修正の平方和は、列の各値を平方し、その和を計算することで計算されます。たとえば、列にx1, x2, ... , xnが含まれている場合、平方和の計算は(x12 + x22 + ... + xn2)となります。修正された平方和とは異なり、未修正の平方和は誤差を含みます。データ値は最初に平均を引かずに二乗します。
列に含まれる観測値の合計数。欠損値の数と非欠損値の数の和を示すために使用します。
合計数 | N | N* |
---|---|---|
149 | 141 | 8 |
サンプルにおける非欠損値の数。
合計数 | N | N* |
---|---|---|
149 | 141 | 8 |
サンプルにおける欠損値の数。欠損値の数は、欠損値記号*を含むセルを参照します。
合計数 | N | N* |
---|---|---|
149 | 141 | 8 |