度量两个变量之间的线性关系程度。相关系数可以是介于 −1 和 +1 之间的值。如果一个变量在另一个变量下降时倾向于上升,则相关系数为负数。相反,如果两个变量倾向于同时上升,则相关系数为正数。
对于变量 x 和 y:
项 | 说明 |
---|---|
![]() | 第一个变量的样本均值 |
sx | 第一个变量的样本标准差 |
![]() | 第二个变量的样本均值 |
sy | 第二个变量的样本标准差 |
n | 观测值个数 |
ρ 的 (1− α)100% 双侧置信区间为 (ρL, ρU),其中,下限 ρL 和上限 ρU 公式如下:
其中:
项 | 说明 |
---|---|
r | 未知相关 ρ 的 Pearson 样本相关估计值 |
ρ | 相关系数 |
n | 观测值个数 |
要计算 Spearman 相关系数和 p 值,请针对数据的秩执行 Pearson 相关。已结合响应的秩是指该结中的平均秩。下表显示了两个数据样本的秩。
C1 | C2 | C3 | C4 |
---|---|---|---|
A | 秩 A | B | 秩 B |
45 | 4 | 23 | 1 |
78 | 6 | 25 | 3 |
24 | 3 | 25 | 3 |
51 | 5 | 25 | 3 |
13 | 1.5 | 34 | 6 |
13 | 1.5 | 30 | 5 |
A 和 B 之间的 Spearman 相关系数为 −0.678,p 值为 0.139。这些值与来自秩 A 和秩 B 中值的 Pearson 相关中的系数和 p 值相同。
Minitab 在计算中会省略其中缺少一个或两个变量数据的行。这两列中包含的行数必须相等。
ρ 的 (1− α)100% 双侧置信区间为 (ρL, ρU),其中,下限 ρL 和上限 ρU 的公式如下:
其中:
Bonnett 和 Wright (2000) 建议对标准误进行如下调整:
项 | 说明 |
---|---|
r | 未知相关 ρ 的 Spearman 样本相关估计值 |
ρ | 相关系数 |
n | 具有变量对的非缺失数据的行的数量 |
对于相关为 0 的检验进行如下假设:
H0:ρ = 0;H1:ρ ≠ 0,其中 ρ 是一对变量之间的 Pearson 相关系数或 Spearman 相关系数。
Pearson 相关系数和 Spearman 相关系数的检验统计量采用相同的公式:
P 值为 2 × P(T > t),其中 T 服从自由度为 n – 2 的 t 分布。
项 | 说明 |
---|---|
r | 样本相关系数 |
n | 观测值个数 |