拟合值又称事件概率或预测概率。事件概率是某个特定结果或事件发生的机会。事件概率可以估计事件发生的可能性,如在牌桌上抽到一张 A,或产生不一致的部件。事件概率的范围从 0(不可能)到 1(必然)。
在二元 Logistic 回归中,响应变量只有两个可能值,如存在或不存在某种特定疾病。事件概率是某一事件的给定因子或协变量模式的响应为 1 的可能性(例如,50 岁以上的妇女患上二型糖尿病的可能性)。
试验中的每个性能都称为一次试验。例如,如果投掷硬币 10 次,并记录了印有头像那面朝上的次数,则您执行了 10 次试验。如果试验是独立的而且可能性相等,则可以通过将事件数量除以试验总数来估计事件概率。例如,如果在 10 次硬币投掷中有 6 次印有头像那面朝上,则估计的事件概率(印有头像那面朝上的投掷)为:
事件数 ÷ 试验数 = 6 ÷ 10 = 0.6
在顺序和名义 Logistic 回归中,响应变量可能具有三种或更多类别。事件概率是给定因子或协变量模式具有特定响应类别的可能性。累积事件概率是给定因子或协变量模式的响应落在每个可能的类别 k 或以下类别的可能性,其中 k 等于响应类别 1…k。
残差是模型对观测值的预测优度的度量标准。当模型与观测值的拟合度较差时,残差较大。Minitab 将针对每个可区分因子/协变量模式计算残差。
绘制残差图可确定模型是否适用且符合回归的假设。检查残差可以提供有关模型对数据的拟合优度的有用信息。一般而言,残差应当是随机分布的,而且没有明显的模式和异常值。如果 Minitab 确定数据包含异常观测值,则会在输出的“异常观测值的拟合与诊断”表中确定这些观测值。有关异常值的更多信息,请转到异常观测值。
标准化残差等于残差值 (ei) 除以其标准差的估计值。
使用标准化残差帮助您检测异常值。大于 2 和小于 −2 的标准化残差通常被视为较大值。“异常观测值的拟合与诊断”表使用“R”来标识这些观测值。如果分析表明有许多异常观测值,那么模型通常会出现严重的失拟。也就是说,该模型不能充分说明因子与响应变量之间的关系。有关更多信息,请转到异常观测值。
标准化残差很有用,因为原始残差可能不是良好的异常值指示符。每个原始残差的变异因与其关联的 X 值而异。尺度不同使其难以评估原始残差的大小。标准化残差可以通过将不同的变异转换为公共尺度来解决此问题。