回归系数描述了预测变量和响应变量之间关系的大小和方向。系数是回归方程中要与项值相乘的数值。
使用系数可以确定预测变量的变化会让事件发生的可能性变大还是变小。一般而言,正系数会使事件发生的可能性变大,负系数会使事件发生的可能性变小。估计系数接近 0 表示预测变量的效应较小。对于绝对预测器,解释取决于编码。
如果反复从同一总体中取样,系数的标准误会估计您将获取的系数估计值之间的变异性。计算假定要估计的样本数量和系数在反复取样的情况下是否保持一致。
使用系数的标准误来度量系数估计值的精确度。标准误越小,估计值越精确。
这些置信区间 (CI) 是值的极差,可能包含模型中每一项的系数的实际值。置信区间的计算采用正态分布。如果样本数量足够多(即样本系数的分布遵循正态分布),置信区间非常精确。
由于样本的随机性,来自总体的两个样本不可能生成相同的置信区间。但是如果随机取样多次,则所获得的特定百分比的置信区间会包含未知的总体参数。这些包含参数的置信区间的百分比是区间的置信水平。
使用置信区间可以评估模型中每个项的总体系数估计值。
例如,当置信水平为 95% 时,包含总体系数值的置信区间的置信度为 95%。置信区间有助于评估结果的实际意义。利用您的专业知识可以确定置信区间是否包含对您的情形有实际意义的值。如果区间因太宽而毫无用处,请考虑增加样本数量。
Z 值是检验统计量,用来度量系数与其标准误之间的比值。
Minitab 使用 Z 值计算 P 值,使用 P 值可以做出有关项和模型的统计显著性的决定。在样本数量足够多(即样本系数的分布遵循正态分布)时,该检验非常精确。
比值足够大表明系数估计值也足够大和精确,明显区别于零。反之,比值较小则表明系数估计值过小或不够精确,难以确定项对响应的效应。
P 值是一个概率,用来测量否定原假设的证据。概率越低,否定原假设的证据越充分。