中位数是数据集的中点。在此中点值所在的点上,有一半的观测值大于中点值,有一半的观测值小于中点值。中位数是通过对观测值排秩并在秩顺序中查找第 [N + 1] / 2 位的观测值来确定的。如果数据中包含偶数个观测值,则中位数是排在第 N / 2 位和第 [N / 2] + 1 位的观测值的平均值。
样本中位数是对每个组的总体中位数的估计值。总体中位数是所有观测值的中位数。
N>(大于总体中位数)。这些值代表每个组中大于总体中位数的观测值个数。Minitab 会创建一个包含 N≤ 值和 N> 值的表格。Minitab 使用这些值执行关联卡方检验和计算检验的 p 值。
如果某个组具有大量属于此类别的观测值,则该组的中位数有可能大于总体中位数。
N≤(小于或等于总体中位数)是每个组中小于或等于总体中位数的观测值个数。Minitab 会创建一个包含 N≤ 值和 N> 值的表格。Minitab 使用这些值执行关联卡方检验和计算检验的 p 值。
如果某个组具有大量属于此类别的观测值,则该组的中位数有可能小于总体中位数。
四分位间距 (Q3 – Q1) 度量每个组中数据的散步。该间距是第 75 个百分位 (Q3) 和第 25 个百分位 (Q1) 之间的距离。
显著不同的四分位间距指示每个组的散步不相同。此条件表明数据可能未满足 Mood 中位数检验的如下假设:每个组具有相同的分布形状和散步。
这些置信区间是可能包含每个总体的实际中位数的值范围。
由于样本的随机性,来自总体的两个样本不可能生成相同的置信区间。但是如果将样本重复许多次,则所获得的特定百分比的置信区间会包含未知的总体参数。这些包含参数的置信区间的百分比是区间的置信水平。
使用置信区间可以评估每个组的总体中位数的估计值。
例如,当置信水平为 95% 时,置信区间包含组中位数的可信度为 95%。置信区间有助于评估结果的实际意义。使用您的专业知识可以确定置信区间是否包括对您的情形有实际意义的值。如果区间因太宽而毫无用处,请考虑增加样本数量。
温度 | 中位数 | N <= 整体中位数 | N > 整体中位数 | Q3 – Q1 | 95% 中位数置信区间 |
---|---|---|---|---|---|
38 | 19 | 4 | 3 | 4.00 | (17.4667, 22.5333) |
42 | 19 | 3 | 3 | 9.50 | (15.3571, 25.6429) |
46 | 22 | 2 | 4 | 7.25 | (15.7857, 26.5714) |
50 | 18 | 4 | 2 | 4.25 | (14.4286, 20.6429) |
整体 | 19 |
这些区间表明温度 38 的中位数为 19.0,置信区间从大约 17.5 延伸到 22.5。
自由度 (DF) 等于数据中的组数减去 1。在原假设下,卡方分布与具有指定自由度的检验统计量分布近似。Minitab 使用卡方分布来估计此检验的 p 值。
卡方统计量是根据一个表计算的,该表由多个单元格组成,这些单元格基于数据中的组以及与这些组相对应的 N≤ 值和 N> 值。Minitab 通过用单元格的观测值与预期值之间差值的平方除以该单元格的预期值,来计算每个单元格的值。卡方统计量是这些值的和。
卡方值越高,观测值和预期值之间的差值也越大。如果卡方值足够大,则表示中位数之间至少有一个差值在统计意义上显著。Minitab 结合使用卡方统计量和卡方分布来计算 p 值。
可以使用卡方统计量来确定是否要否定原假设。但是,使用检验的 p 值做出相同的决定通常更实际且更方便。
P 值是一个概率,用来度量否定原假设的证据。概率越低,否定原假设的证据越充分。
使用 p 值确定中位数的任何差值在统计意义上是否显著。