确定哪个模型关系能够以最佳方式拟合数据并评估模型关系的强度。
为了更好地显示特定模型拟合对您的数据的适合程度,请创建一个带有拟合回归线的散点图。
如果您的数据似乎拟合模型,则可以使用回归分析研究关系。
要量化线性(直线)关系的强度,请使用相关分析。
偏斜数据和多模态数据表明数据可能不正常。异常值可能表明数据中存在其他情况。
当数据偏斜时,大多数数据位于图形的高或低侧。偏斜表明数据可能未呈正态分布。在边际图中,请在边际中查找偏斜数据的指示符。
如果已知数据本身未偏斜,请调查可能的原因。如果您希望分析严重偏斜的数据,请阅读该分析的“数据注意事项”主题,以确保您可以使用非正常数据。
异常值是远离其他数据值的数据值,可能会显著影响您的结果。在边际图中,请在边际中的散点图和图形上查找异常值。
尝试确定导致任何异常值的原因。更正任何数据输入错误或测量误差。考虑删除与异常的单次事件(也称为特殊原因)相关联的数据值。然后,重新执行分析。
多模态数据具有多个峰值。(峰值表示一组数据的模式。)如果数据是从多个过程中或在多个条件(如多个温度)下收集的,通常会出现多模态数据。
如果您具有其他可用来对观测值进行分组的信息,则可以创建一个包含此信息的组变量。然后,可以创建含组的直方图或点图,以确定组变量是否导致数据中的峰值。