输出还可以确定哪个响应水平是参考事件。
使用响应信息检查分析中的数据量。通常情况下,每个水平出现多次的随机样本越大,提供的有关总体的推断越精确。
还可以使用响应信息确定哪个事件是参考事件。系数和优势比等统计量的解释取决于哪个事件是参考事件。
因子信息表显示设计中的因子、水平数、水平值。因子只能取有限数量的可能值,称为因子水平。因子水平可以是文本或数字。虽然可能存在多个值,但数字因子会在试验中使用一些受控制的值。
使用因子信息表查看分析的水平数。例如,质量分析员计划研究在制造过程中可能影响塑性强度的因子。该分析员将“添加剂”也考虑在内。“添加剂”是一个类别变量,可以是类型 A 或类型 B。
因子 | 水平数 | 值 |
---|---|---|
添加剂 | 2 | A, B |
各个因子可以交叉或嵌套。当一个因子的每个水平与另一个因子的每个水平组合出现时,这两个因子就是交叉的。当一个因子的一组水平仅出现在第二个因子的一个水平处时,这两个因子就是嵌套的。例如,如果某个设计包含机器和操作员,那么在所有操作员使用所有机器时,这些因子是交叉的。但是,如果每台机器都具有另一组操作员,那么操作员将嵌套在机器中。
在因子信息表中,圆括号中的内容表示嵌套因子。例如,标准(评估员)表示标准嵌套在评估员内。在这种情况下,嵌套表示每个评估员都有一组自己的标准部件。对每个嵌套水平重复每个嵌套因子的各个因子水平,这会增加嵌套因子的水平数。在此示例中,每个评估员都有 5 个标准,但由于标准嵌套在评估员中,因此标准有 20 个不同的水平。
因子 | 水平数 | 值 |
---|---|---|
标准(检验员) | 20 | 1(Amanda), 2(Amanda), 3(Amanda), 4(Amanda), 5(Amanda), 1(Britt), 2(Britt), 3(Britt), 4(Britt), 5(Britt), 1(Eric), 2(Eric), 3(Eric), 4(Eric), 5(Eric), 1(Mike), 2(Mike), 3(Mike), 4(Mike), 5(Mike) |
检验员 | 4 | Amanda, Britt, Eric, Mike |
有关因子的更多信息,请转到因子和因子水平、什么是因子、交叉因子和嵌套因子?和什么是固定因子和随机因子之间的差值?。
名义 Logistic 回归方程分别处理每个名义结果。Logistic 回归方程由多个 Logit 函数组成,分别对应于每个响应值减一。对于预测变量,每个方程都有一个唯一的斜率。这些方程可以在预测变量变化时,评估一个名义结果的概率相对于另一个名义结果的概率的变化情况。
使用系数检查当预测变量变化时结果的概率的变化情况。预测变量的估计系数表示当模型中的其他预测变量保持恒定时,预测变量发生一个单位的变化时链接函数的变化。系数和结果的概率之间的关系取决于分析的多个方面,包括响应变量的参考结果和类别预测变量的参考水平。一般情况下,当预测变量增大时,正系数会使参考结果发生的可能性变小。当预测变量增大时,负系数会使参考结果发生的可能性变大。估计系数接近 0 表示预测变量的效应较小。
例如,一位学校管理人员想要评估不同的教学方法。她使用年龄和教学方法预测学生首选的学科。第一个结果事件就是响应信息表中的第一个事件,也是响应变量的参考结果。对于该数据,参考结果是学生首选自然科学。Logit 1 比较学生首选数学而不是自然科学的概率。在此方程中,年龄的系数的 P 值大于 0.7。这种较大的 P 值表示年龄对学生是否首选数学而不是自然科学的效应较小。
Logit 2 比较艺术与自然科学。在此方程中,年龄的系数大于比较数学与自然科学的系数。年龄的系数为正。随着学生年龄的增长,学生首选艺术而不是自然科学的可能性变大。
类别预测变量的系数的解释取决于因子的参考水平。在教学方法数据中,教学方法的两个水平为“演示”和“解释”。“演示”不在系数表中,因此“演示”是参考水平。在对数学与自然科学进行比较的方程中,“解释”的 P 值大于 0.5。这种较大的 P 值表示教学方法对学生是否首选数学而不是自然科学的效应较小。
在 Logit 2 中,“解释”的系数大于对数学与自然科学进行比较的系数。此系数的 P 值小于 0.05,因此此系数在 0.05 水平下具有统计显著性。“解释”在此方程中的系数为正。当教学方法为“解释”时,学生首选艺术的可能性变大。
变量 | 值 | 计数 | |
---|---|---|---|
科目 | 自然科学 | 10 | (参考事件) |
数学 | 11 | ||
艺术 | 9 | ||
合计 | 30 |
因子 | 水平数 | 值 |
---|---|---|
教学方法 | 2 | 展示, 解释 |
95% 置信区间 | |||||||
---|---|---|---|---|---|---|---|
自变量 | 系数 | 系数标准误 | Z | P | 优势比 | 下限 | 上限 |
Logit 1:(数学/自然科学) | |||||||
常量 | -1.12266 | 4.56425 | -0.25 | 0.806 | |||
教学方法 | |||||||
解释 | -0.563115 | 0.937591 | -0.60 | 0.548 | 0.57 | 0.09 | 3.58 |
年龄 | 0.124674 | 0.401079 | 0.31 | 0.756 | 1.13 | 0.52 | 2.49 |
Logit 2:(艺术/自然科学) | |||||||
常量 | -13.8485 | 7.24256 | -1.91 | 0.056 | |||
教学方法 | |||||||
解释 | 2.76992 | 1.37209 | 2.02 | 0.044 | 15.96 | 1.08 | 234.90 |
年龄 | 1.01354 | 0.584494 | 1.73 | 0.083 | 2.76 | 0.88 | 8.66 |
自由度 | G | P 值 |
---|---|---|
4 | 12.825 | 0.012 |
方法 | 卡方 | 自由度 | P |
---|---|---|---|
Pearson | 6.95295 | 10 | 0.730 |
偏差 | 7.88622 | 10 | 0.640 |
如果反复从同一总体中取样,系数的标准误会估计您将获取的系数估计值之间的变异性。计算假定要估计的样本数量和系数在反复取样的情况下是否保持一致。
使用系数的标准误来度量系数估计值的精确度。标准误越小,估计值越精确。
Z 值是检验统计量,用来度量系数与其标准误之间的比率。
Minitab 使用 Z 值计算 P 值,使用 P 值可以做出有关项和模型的统计显著性的决定。在样本数量足够多(即样本系数的分布遵循正态分布)时,该检验非常精确。
距离 0 足够远的 Z 值表示系数估计值足够大和精确,在统计上不同于 0。相反,靠近 0 的 Z 值表示系数估计值太小或太不精确,无法确定项对于响应变量是否有影响。
P 值是一个概率,用来度量否定原假设的证据。概率越低,否定原假设的证据越充分。
优势比可比较两个结果的几率。结果的几率等于比较结果出现的概率除以参考结果出现的概率。
使用优势比了解预测变量的效应。优势比的解释取决于预测变量是类别预测变量还是连续预测变量。在 Logistic 回归表中,比较结果是 Logit 标记后的第一个结果,参考结果是第二个结果。每个 Logit 的参考结果都相同。
优势比大于 1,表示当预测变量增大时比较结果发生的可能性大于参考结果发生的可能性。优势比小于 1,表示参考结果发生的可能性大于比较结果发生的可能性。
例如,一位学校管理人员想要评估不同的教学方法。对于 Logit 1,比较结果为数学。对于 Logit 2,比较结果为艺术。参考结果为自然科学。在 Logit 2 中,优势比的估计值为 2.76,该值大于 1。随着年龄的增长,学生首选艺术而不是自然科学的可能性变大。每增加一岁,学生首选艺术的几率比他们首选自然科学的几率大 3 倍。
95% 置信区间 | |||||||
---|---|---|---|---|---|---|---|
自变量 | 系数 | 系数标准误 | Z | P | 优势比 | 下限 | 上限 |
Logit 1:(数学/自然科学) | |||||||
常量 | -1.12266 | 4.56425 | -0.25 | 0.806 | |||
教学方法 | |||||||
解释 | -0.563115 | 0.937591 | -0.60 | 0.548 | 0.57 | 0.09 | 3.58 |
年龄 | 0.124674 | 0.401079 | 0.31 | 0.756 | 1.13 | 0.52 | 2.49 |
Logit 2:(艺术/自然科学) | |||||||
常量 | -13.8485 | 7.24256 | -1.91 | 0.056 | |||
教学方法 | |||||||
解释 | 2.76992 | 1.37209 | 2.02 | 0.044 | 15.96 | 1.08 | 234.90 |
年龄 | 1.01354 | 0.584494 | 1.73 | 0.083 | 2.76 | 0.88 | 8.66 |
对于类别预测变量,优势比可以对比较结果在两个不同的预测变量水平下发生的几率进行比较。比较水平位于 Logistic 回归表中,并且有一个估计的优势比。优势比大于 1,表示当类别预测变量从参考水平变为比较水平时,相对于参考结果,比较结果发生的可能性变大。优势比小于 1,表示当类别预测变量从参考水平变为比较水平时,相对于参考结果,比较结果发生的可能性变小。
例如,一位学校管理人员想要评估不同的教学方法。对于 Logit 1,比较结果为数学。对于 Logit 2,比较结果为艺术。参考结果为自然科学。对于 Logit 2,教学方法的优势比估计值为 15.96,该值大于 1。当教学方法从“演示”变为“解释”时,学生首选艺术的几率大约比他们首选自然科学的几率大 16 倍。
95% 置信区间 | |||||||
---|---|---|---|---|---|---|---|
自变量 | 系数 | 系数标准误 | Z | P | 优势比 | 下限 | 上限 |
Logit 1:(数学/自然科学) | |||||||
常量 | -1.12266 | 4.56425 | -0.25 | 0.806 | |||
教学方法 | |||||||
解释 | -0.563115 | 0.937591 | -0.60 | 0.548 | 0.57 | 0.09 | 3.58 |
年龄 | 0.124674 | 0.401079 | 0.31 | 0.756 | 1.13 | 0.52 | 2.49 |
Logit 2:(艺术/自然科学) | |||||||
常量 | -13.8485 | 7.24256 | -1.91 | 0.056 | |||
教学方法 | |||||||
解释 | 2.76992 | 1.37209 | 2.02 | 0.044 | 15.96 | 1.08 | 234.90 |
年龄 | 1.01354 | 0.584494 | 1.73 | 0.083 | 2.76 | 0.88 | 8.66 |
这些置信区间 (CI) 是可能包含优势比的实际值的值范围。置信区间的计算采用正态分布。如果样本数量足够多(即样本优势比的分布遵循正态分布),置信区间将非常精确。
由于样本的随机性,来自总体的两个样本不可能生成相同的置信区间。但是如果随机取样多次,则所获得的特定百分比的置信区间会包含未知的总体参数。这些包含参数的置信区间的百分比是区间的置信水平。
使用此置信区间评估优势比的估计值。
例如,对于 95% 置信区间,置信区间包含总体优势比的值的可信度为 95%。置信区间有助于评估结果的实际意义。使用您的专业知识可以确定置信区间是否包括对您的情形有实际意义的值。如果区间因太宽而毫无用处,请考虑增加样本数量。
此检验是可同时考虑某个类别预测变量的所有系数的整体检验。该检验可用于具有超过 2 个水平的类别预测变量。
使用该检验确定具有超过 1 个系数的类别预测变量是否与响应事件在统计意义上存在显著关系。当一个类别预测变量具有超过 2 个水平时,各个水平的系数的 P 值不同。整体检验可提供一个有关该预测变量在统计意义上是否显著的答案。
Minitab 可以最大化对数似然函数,以找到估计系数的最优值。
使用对数似然比较使用相同数据估计系数的两个模型。由于值为负,因此值越接近于 0,模型与数据拟合得越好。
当您向模型中添加项时,对数似然无法减小。例如,5 项模型的对数似然大于使用相同项构建的任何 4 项模型的对数似然。因此,对数似然最适用于比较具有相同样本数量的模型。要对单独项做出决策,通常您可以查看项在不同 Logit 中的 P 值。
此检验是可考虑预测变量在模型中的所有系数的整体检验。
使用该检验确定模型中是否至少有一个预测变量与响应事件的关联在统计上显著。通常,您无法解释 G 统计量或自由度 (DF)。DF 等于模型中预测变量的系数个数。
Pearson 优度拟合检验会评估当前模型和全模型之间的差异。
偏差优度拟合检验会评估当前模型和全模型之间的差异。