使用均值来描述具有表示数据中心的单个值的样本。很多统计分析使用均值作为数据分布中心的一个标准度量。
使用均值的标准误可以确定样本均值对总体均值的估计精确度。有关更多信息,请转到所有统计量和图形并单击“均值标准误”。
使用标准差可以确定数据从均值扩散的程度。有关更多信息,请转到什么是标准差?。
使用方差可以确定数据从均值扩散的程度。方差等于标准差的平方。有关更多信息,请转到什么是方差?。
变异系数是(用 COV 表示)散布的度量标准,这种散布描述数据相对于均值的变异程度。变异系数将进行调整,使值在无单位尺度上。因为此调整,您可以用变异系数来取代标准差,以比较拥有不同单位或显著不同均值的数据中的变异。有关更多信息,请转到所有统计量和图形并单击“CoefVar”。
极差是样本中的最大数据值与最小数据值之差。极差表示包含所有数据值的最小区间。
和是所有数据值的合计。
最小值是指样本中的最小数据值。可以使用最小值确定可能的异常值或数据输入错误。评估数据散布最简单的方法之一就是比较最小值和最大值。
样本中 25% 的数据值小于第一个四分位数值。
中位数是数据分布中心的另一个度量。中位数受异常值的影响通常比均值要小。一半的数据值大于中位数值,一半的数据值小于中位数值。
样本中 25% 的数据值大于第三个四分位数值。
最大值是指样本中最大的数据值。使用最大值可以确定可能的异常值或数据输入错误。评估数据散布最简单的方法之一就是比较最小值和最大值。
四分位间距 (IQR) 是第一个四分位数 (Q1) 和第三个四分位数 (Q3) 之间的距离。使用四分位间距可以描述数据的散布。数据越分散,四分位间距越大。
使用众数和单个表示样本中最常见值的值可以描述一整组观测值。您可以使用众数连同均值和中位数来获取数据分布的总体特征。
样本中非缺失值的个数。Minitab 在输出中将此值显示为 N。
样本中缺失值的个数。缺失值个数是指包含缺失值符号 * 的单元格数。Minitab 在输出中将此值显示为 N*。
列中观测值的总数。用于表示 N 缺失和 N 非缺失之和。Minitab 在输出中将此值显示为总计数。
年级 | 计数 | CumN | 计算 |
---|---|---|---|
1 | 49 | 49 | 49 |
2 | 58 | 107 | 49 + 58 |
3 | 52 | 159 | 49 + 58 + 52 |
4 | 60 | 219 | 49 + 58 + 52 + 60 |
5 | 48 | 267 | 49 + 58 + 52 + 60 + 48 |
6 | 55 | 322 | 49 + 58 + 52 + 60 + 48 + 55 |
百分比表示一个类别对整体的贡献。百分比的计算方法是将类别的频率除以总频率,然后乘以 100。例如,如果检查 400 个部件,其中有 21 个部件存在缺陷,则缺陷百分比将为.
累积百分比是包含该类别的所有百分比值的合计,与每个类别的单个百分比相对。
使用截尾均值可以消除非常大或非常小的值对均值的影响。当数据中包含异常值时,与均值相比,截尾均值能够更好地度量集中趋势。
平方值的未校正总和的计算方法为:对列中每个值求平方,然后将这些平方值进行加总。例如,如果列中包含 x1、x2、... 、xn,则平方和的计算公式为 (x12 + x22 + ... + xn2)。与平方值的校正总和不同,未校正的平方值总和中包含错误。数据值将直接计算平方,而不先减去均值。
使用偏度可以确定数据的不对称程度。有关更多信息,请转到偏度和峰度如何影响您的分布。
使用 kurtosis 可以确定与正态曲线相比,数据的尖锐程度。有关更多信息,请转到偏度和峰度如何影响您的分布。
均方递差 (MSSD) 是方差的估计值。MSSD 的一个可能用法是检验一系列观测值是否随机。在质量控制中,MSSD 的一个可能用法是在子组大小为 1 时估计方差。