数据注意事项公差区间(非正态分布)

为了确保结果有效,请在收集数据、执行分析和解释结果时考虑以下准则。

数据必须是连续型数据
连续数据是测量值,可以是连续尺度上位于某个值范围内的任何数值(包括分数值或小数值)。常见示例包括长度、重量和温度等测量值。
数据必须服从所选分布才能使用参数方法的结果
如果您的数据服从所选分布,则参数方法比非参数方法更准确和经济。只要所选分布适合您的数据,使用参数方法就可以取得较小的边际误差,即使观测值较少时也是如此。
当严重偏离所选分布时,参数方法不可靠。只有当已知总体服从所选分布时,才使用参数方法。如果您不确定总体是否服从所选分布,或者您已知总体不服从所选分布,请使用非参数方法。
为非参数方法收集足够的数据
非参数方法通常要求使用比参数方法更多的样本数量。例如,如果区间中最小总体百分比为 95%,则样本数量应该大约为 90 或更多,这样才能取得准确的公差区间。区间中总体百分比越大,所需的样本数量越多。例如,如果区间中的最小总体百分比为 99%,则样本数量应该大约为 500 或更多,才能获得准确的双侧 95% 公差区间。要获得准确的公差区间,取得的置信水平必须接近目标置信水平。如果样本数量不够多,则此非参数区间为无信息区间,其范围为从负无穷大到正无穷大。在这种情况下,Minitab 将根据数据范围显示一个有限区间。因此,取得的置信水平将远低于目标置信水平。