分析明确筛选设计的二元响应的相关性度量

在相联度量表中查找每个统计量的定义和解释指导。

对于二元 Logistic 回归,每个观测事件会与每个非事件配对。这些类别可描述以下对:
  • 一致:对于事件发生时的观测值,事件发生的预测概率较高。
  • 不一致:对于事件发生时的观测值,事件发生的预测概率较低。
  • 结:对于事件发生时的观测值和非事件发生时的观测值,事件发生的预测概率相同。

解释

使用多个对来比较模型的预测能力。一致对的百分比越大,模型的执行能力越好。

Somer 的 D

Somer 的 D 是一致和不一致对之间的比率差,其中包括结对。

解释

使用 Somer 的 D 可比较模型的预测能力。值越大,预测能力越好。例如,如果 75% 的对为一致对,25% 的对为不一致对,则 Somer 的 D 为 0.5。

当模型预测有 0 个结对时,Somer 的 D 和 Goodman-Kruskal Gamma 统计量相同。结对越多,Goodman-Kruskal Gamma 统计量超出 Somer 的 D 就越多。

Goodman-Kruskal Gamma

Goodman-Kruskal Gamma 是一致和不一致对之间的比率差,其中不包括结对。

解释

使用 Goodman-Kruskal Gamma 比较模型的预测能力。值越大,预测能力越好。例如,如果 75% 的非结对是一致的,25% 的非结对是不一致的,Goodman-Kruskal Gamma 为 0.5。

当模型预测有 0 个结对时,Somer 的 D 和 Goodman-Kruskal Gamma 统计量相同。结对越多,Goodman-Kruskal Gamma 统计量超出 Somer 的 D 就越多。

Kendall's Tau-a

Kendall 的 Tau-a 是所有可能对中一致和不一致对的比率差,其中包括响应值相同的对。

解释

使用 Kendall 的 Tau-a 比较模型的预测能力。值越大,预测能力越好。Kendall 的 Tau-a 始终小于 Somer 的 D 和 Goodman-Kruskal Gamma 统计量,因为这两个统计量不包括响应值相同的对。