在评估分布拟合时要考虑的内容

在执行可靠性分析的过程中,选择合适的分布是最基本的第一个步骤。如果选定的分布对数据的拟合效果不是很好,则可靠性估计值将不准确。还需要拟合效果好的分布模型来推断超出数据范围的信息。为可靠性数据选择最合适的分布时,请考虑以下内容:
  • 使用情况的工程和历史知识。例如,数据是否服从对称分布?故障是保持固定不变、递增还是递减?过去在类似的情况中什么分布起作用?
  • 执行分布分析并使用概率图比较候选分布或评估所选分布是否适合。
  • 评估 Anderson-Darling 拟合优度统计量和 Pearson 相关系数:
    • Anderson-Darling 值越低,通常表明拟合分布较好。会为极大似然估计法 (MLE) 和最小二乘估计法 (LSE) 计算 Anderson-Darling 统计量。
    • Pearson 相关系数的值越高,表明拟合分布越好。相关系数适用于 LSE 方法。
  • 评估不同的分布如何影响您的结论:
    • 如果多个分布提供了对数据的充分拟合并推出了类似的结论,则选择哪个分布很可能都没有关系。
    • 如果结论根据所选分布的不同而异,则您可以报告最保守的结论或收集更多的信息。

可用来对偏斜数据或对称数据建模的分布

通常,可以使用多个分布对一组数据建模,也可以使用具有一个、两个或三个参数的分布进行建模。例如,对于每种类型的数据,可能有多个分布能够与数据拟合:
右偏斜数据
通常,可以拟合 Weibull 或对数正态分布并获得对数据的良好拟合。
对称数据
通常,可以拟合 Weibull 或对数正态分布。有时,可以拟合正态分布(根据尾部的重量)并获得类似的结果。
左偏斜数据
通常,您可以拟合 Weibull 或最小极值分布。
有时,可以使用 2 或 3 个参数对一组特定的数据进行建模。3 参数模型可以为某些数据提供更好的拟合,但还可能会导致过度拟合模型。过度拟合意味着模型能够很好地拟合样本数据,但无法拟合来自同一个总体的另一个样本。通常,专家建议选择最简单的适用模型。