平均值

使用均值来描述具有表示数据中心的单个值的样本。很多统计分析使用均值作为数据分布中心的一个标准度量。

均值标准误

使用均值的标准误可以确定样本均值对总体均值的估计精确度。有关更多信息,请转到所有统计量和图形并单击“SE 均值”。

标准差

使用标准差可以确定数据从均值扩散的程度。有关更多信息,请转到所有统计量和图形并单击“StDev”。

单方差

使用方差可以确定数据从均值扩散的程度。方差等于标准差的平方。有关更多信息,请转到所有统计量和图形并单击“方差”。

变异系数

变异系数 (COV) 是对散布(描述数据相对于均值的变异性)的度量。变异系数将进行调整,使值在无单位尺度上。因为此调整,您可以用变异系数来取代标准差,以比较拥有不同单位或显著不同均值的数据中的变异。有关更多信息,请转到所有统计量和图形并单击“CoefVar”。

在工作表中,变异系数的列名是 CVariation。

极差

极差是样本中的最大数据值与最小数据值之差。极差表示包含所有数据值的最小区间。

总和是所有数据值的总和。

望小

最小值是样本中的最小数据值。可以使用最小值确定可能的异常值或数据输入错误。评估数据散布最简单的方法之一就是比较最小值和最大值。

第一个四分位数

样本中 25% 的数据值小于第一个四分位数值。在工作表中,对于第一个四分位数的列名为 Q1。

中间距离

中位数是数据分布中心的另一个度量。中位数受异常值的影响通常比均值要小。一半的数据值大于中位数值,一半的数据值小于中位数值。

第三个四分位数

样本中 25% 的数据值大于第三个四分位数值。在工作表中,对于第三个四分位数的列名为 Q3。

望大

最大值是指样本中的最大数据值。使用最大值可以确定可能的异常值或数据输入错误。评估数据散布最简单的方法之一就是比较最小值和最大值。

四分位间距

四分位间距 (IQR) 是第一个四分位数 (Q1) 和第三个四分位数 (Q3) 之间的距离。使用四分位间距可以描述数据的散布。大 IQR 值表示数据中存在较大的散布。

N 非缺失

样本中非缺失值的个数。 在工作表中,对应于未丢失 N 的列名为 N。

N 缺失

样本中缺失值的个数。缺失值个数是指包含缺失值符号 * 的单元格数。 在工作表中,对应于丢失 N 的列名为 NMissing。

N 合计

列中观测值的总数。用于表示 N 缺失和 N 非缺失之和。 在工作表中,对应于 N 总和的列名为 Count。

累积 N

累积 N 是连续类别中观测值个数的累计。例如,小学记录一到六年级的学生数。CumN 列包含学生总体的累积计数:
年级 计数 CumN 计算
1 49 49 49
2 58 107 49 + 58
3 52 159 49 + 58 + 52
4 60 219 49 + 58 + 52 + 60
5 48 267 49 + 58 + 52 + 60 + 48
6 55 322 49 + 58 + 52 + 60 + 48 + 55

百分比

百分比表示一个类别对整体的贡献。百分比的计算方法是将类别的频率除以总频率,然后乘以 100。例如,如果检查 400 个部件,其中有 21 个部件存在缺陷,则缺陷百分比将为

累积百分比

累积百分比是包含该类别的所有百分比值的合计,与每个类别的单个百分比相对。在工作表中,累积百分比的列名为 CumP。

截尾均值

可使用微调均值消除非常大或非常小的值对均值的影响。当数据包含异常值时,对于度量集中趋势而言,微调均值可能是比均值更好的度量方法。有关更多信息,请转到所有统计量和图形并单击“TrMean”。

平方和

平方的未校正总和是通过对列中每个值求平方来计算的,并计算这些平方值的总和。也就是说,如果列包含 x1, x2, ... , xn,则平方和将计算 (x12 + x22 + ... + xn2)。与平方的校正总和不同,平方的未校正总和中包括错误。将在不先减去均值的情况下对数据值求平方。

偏度

可使用偏度确定数据的不对称程度。有关更多信息,请转到偏度和峰度如何影响您的分布

峰度

可使用峰度确定数据的波峰相对于正态曲线的尖锐程度。有关更多信息,请转到偏度和峰度如何影响您的分布

均方递差

均方递差 (MSSD) 是方差的估计值。您可以使用 MSSD 检验一系列观测值是否随机。在质量控制中,可使用 MSSD 估计在子组大小为 1 时的方差。