변동성 분석에 대한 코드화된 계수 표

코드화된 계수 표의 모든 통계량에 대한 정의 및 해석 방법을 확인해 보십시오.

효과

효과는 항과 반응 변수 간 관계의 크기와 방향을 설명합니다. Minitab에서는 요인과 요인 간 교호작용에 대한 효과를 계산합니다.

해석

요인에 대한 효과는 요인이 낮은 수준에서 높은 수준으로 변경되는 경우 평균 반응의 예측되는 변화를 나타냅니다. 효과는 코드화된 계수 값의 두 배입니다. 효과의 부호는 항과 반응 간 관계의 방향을 나타냅니다.

교호작용에 요인이 많을수록 효과를 해석하기가 더 어렵습니다. 요인 및 요인 간 교호작용에 대해 효과의 크기는 일반적으로 하나의 항이 반응 변수에 미치는 영향의 실제적 유의성을 평가하는 좋은 방법입니다.

그러나 유의성에 대한 계산에서는 반응 데이터의 변동도 고려하기 때문에 효과의 계수 크기는 항이 통계적으로 유의한지 여부를 나타냅니다. 통계적 유의성을 확인하려면 항에 대한 p-값을 조사하십시오.

비율 효과

비율 효과를 사용하면 요인 효과의 실질적 유의성을 측정할 수 있습니다. 비율 효과는 요인이 낮은 수준에서 높은 수준으로 변경될 때 이에 따라 반응의 표준 편차가 비례적으로 증가하거나 감소하는 정도를 나타냅니다. 비율 효과가 1에 가까워질수록 요인의 효과는 줄어듭니다.

비율 효과는 요인의 높은 수준에 있는 반응의 표준 편차와 요인의 낮은 수준에 있는 반응의 표준 편차에 대한 비율을 추정합니다. 요인의 효과를 거듭제곱하여 비율 효과를 쉽게 계산할 수 있습니다.

해석

예는 다음과 같습니다.
  • 재료의 비율 효과는 0.3830입니다. 즉, 절연에서 공식 2를 사용할 때 표준 편차가 공식 1을 사용할 때 값의 38%입니다. 재료*주입 압력 교호작용이 유의하므로 교호작용 효과를 고려하지 않고 재료에 대한 주효과를 해석할 수 없습니다.
  • 재료*주입 압력 교호작용의 경우 비율 효과는 0.3709입니다.

주입 압력은 동일하게 유지하면서 재료를 공식 1에서 공식 2로 변경하는 경우의 결과를 예측하려면 재료의 비율 효과와 교호작용의 비율 효과를 곱하거나 재료의 비율 효과를 교호작용의 비율 효과로 나눕니다. 주입 압력이 낮은 수준인 경우 재료의 비율 효과를 교호작용의 비율 효과로 나누면 0.3830/0.3709 = 1.0326의 값을 얻습니다. 즉, 표준 편차가 약 3%로 조금 증가합니다. 주입 압력이 높은 수준인 경우 두 비율 효과를 곱하면 0.3830 * 0.3709 = 0.1421의 값을 얻습니다. 즉, 표준 편차가 약 85%(1 - 0.1421 = 0.8579) 감소합니다.

두 요인이 모두 낮은 수준(또는 높은 수준)으로 설정된 경우 교호작용 항은 높은 수준이 됩니다(-1 * -1 = 1, 1 * 1 = 1). 이때 -1은 낮은 수준이고 1은 높은 수준입니다. 한 요인은 높은 수준으로 설정되고 다른 요인은 낮은 수준으로 설정된 경우 교호작용 항은 낮은 수준이 됩니다(-1 * 1 = -1). 주입 압력을 낮은 수준으로 유지하면서 재료를 낮은 수준에서 높은 수준으로 변경하면 교호작용 항이 높은 수준에서 낮은 수준으로 변경됩니다. 두 비율이 반대 방향으로 작용하며 두 비율을 나누어 효과를 확인할 수 있습니다. 주입 압력이 높은 경우 재료를 낮은 수준에서 높은 수준으로 변경해도 교호작용 항이 높은 수준에서 낮은 수준으로 변경됩니다. 두 비율이 같은 방향으로 작용하며 두 비율을 곱하여 효과를 확인할 수 있습니다.

Ln에 대한 코드화된 계수(표준)

효과비율 효과계수SE 계수T-값P-값VIF
상수    0.34240.04817.120.001 
재료-0.95980.3830-0.47990.0481-9.990.0001.00
주입 압력-0.18450.8315-0.09220.0481-1.920.1131.00
주입 온도0.05551.05710.02780.04810.580.5891.00
냉각 온도-0.12590.8817-0.06290.0481-1.310.2471.00
재료*주입 압력-0.99180.3709-0.49590.0481-10.320.0001.00
재료*주입 온도0.18751.20620.09370.04811.950.1091.00
재료*냉각 온도0.00561.00560.00280.04810.060.9561.00
주입 압력*주입 온도-0.07920.9239-0.03960.0481-0.820.4481.00
주입 압력*냉각 온도-0.09000.9139-0.04500.0481-0.940.3921.00
주입 온도*냉각 온도0.00661.00660.00330.04810.070.9481.00

계수

계수는 모형의 항과 반응 변수 사이에 존재하는 관계의 크기와 방향을 설명합니다. 여러 항 사이의 다중 공선성을 최소화하기 위해 계수의 단위는 모두 코드화됩니다.

해석

항의 계수는 모형의 다른 항이 상수로 고정된 상태에서 해당 항이 1 코드화된 단위만큼 증가하는 경우 평균 반응의 변화를 나타냅니다. 계수의 부호는 항과 반응 간 관계의 방향을 나타냅니다.

계수의 크기는 효과 크기의 1/2입니다. 효과는 요인이 낮은 수준에서 높은 수준으로 변경되는 경우 예측 평균 반응의 변화를 나타냅니다.

효과의 크기는 일반적으로 하나의 항이 반응 변수에 미치는 영향의 실제적 유의성을 평가하는 좋은 방법입니다. 그러나 유의성에 대한 계산에서는 반응 데이터의 변동도 고려하기 때문에 효과의 계수 크기는 항이 통계적으로 유의한지 여부를 나타냅니다. 통계적 유의성을 확인하려면 항에 대한 p-값을 조사하십시오.

공변량, 블럭, 중앙점 항과 같이 요인이 아닌 항에는 높은 수준과 낮은 수준이 없습니다. 이 항들에는 효과는 없지만 계수가 있습니다.
공변량
공변량에 대한 계수는 공변량과 같은 단위입니다. 계수는 공변량의 한 단위 증가에 대한 예측 평균 반응의 변화를 나타냅니다. 계수가 음수이면 공변량이 증가함에 따라 반응의 예측 평균이 감소합니다. 계수가 양수이면 공변량이 증가함에 따라 반응의 예측 평균이 증가합니다. 공변량은 코드화되지 않고 일반적으로 요인에 직교하지 않기 때문에 공변량이 있으면 VIF 값이 증가합니다. 자세한 내용은 VIF 관련 절을 참조하십시오.
블럭
블럭은 (−1, 0, +1) 코드화 방법을 사용하는 범주형 변수입니다. 각 계수는 블럭에 대한 반응 평균과 반응의 전체 평균 간의 차이를 나타냅니다.
중앙점
중앙점은 (0, 1) 코드화 방법을 사용하는 범주형 변수입니다. 기준 수준은 범주형 변수가 1인 경우이며 설계의 요인 점에서의 데이터에 대한 것입니다. 범주형 변수는 설계의 중앙점에서 0입니다. 일반적으로 p-값을 사용하여 요인의 2차 효과를 추정하기 위한 추가 데이터 수집의 값을 결정합니다. 일반적으로 중앙점 항은 설계의 요인 수만큼 별칭 관계가 있는 2차 효과를 나타내기 때문에 중앙점의 계수를 해석하지 않습니다.

SE 계수

계수의 표준 오차는 동일한 모집단에서 반복해서 표본을 추출하는 경우 얻을 수 있는 계수 추정치 간의 변동성을 추정합니다. 이 계산에서는 반복해서 표본을 추출해도 추정할 실험 설계와 계수가 변경되지 않는다고 가정합니다.

해석

계수의 표준 오차를 사용하여 계수 추정치의 정확도를 측정할 수 있습니다. 표준 오차가 작을수록 추정치의 정확도가 높아집니다. 계수를 표준 오차로 나누면 t-값이 계산됩니다. 이 t-통계량과 관련된 p-값이 유의 수준보다 작은 경우 계수가 통계적으로 유의하다는 결론을 내립니다.

t-값

t-값은 계수와 계수의 표준 오차 간의 비율을 측정합니다.

해석

Minitab에서는 t-값을 사용하여 계수가 0과 유의하게 다른지 여부를 검정하기 위해 사용하는 p-값을 계산합니다.

t-값을 사용하여 귀무 가설의 기각 여부를 확인할 수 있습니다. 그러나 귀무 가설의 기각에 대한 분계점이 자유도에 종속되지 않기 때문에 p-값이 더 자주 사용됩니다. t-값 사용에 대한 자세한 내용은 t-값을 사용하여 귀무 가설의 기각 여부 확인에서 확인하십시오.

계수에 대한 신뢰 구간(95% CI)

신뢰 구간(CI)은 모형의 각 항에 대한 계수의 실제 값이 포함될 가능성이 높은 값의 범위입니다.

표본이 랜덤이기 때문에 모집단의 두 표본에서 동일한 신뢰 구간이 생성될 가능성은 없습니다. 그러나 여러 개의 랜덤 표본을 추출하면 일정한 백분율의 신뢰 구간에는 알 수 없는 모집단 모수가 포함됩니다. 모수를 포함하는 이러한 신뢰 구간의 백분율이 해당 구간의 신뢰 수준입니다.

신뢰 구간은 다음 두 부분으로 구성됩니다.
점 추정치
이 단일 값은 표본 데이터를 사용하여 모집단 모수를 추정합니다. 신뢰 구간은 점 추정치를 중심으로 합니다.
오차 한계
오차 한계는 신뢰 구간의 너비를 정의하며 표본에서 관측된 변동성, 표본 크기 및 신뢰 수준에 의해 결정됩니다. 신뢰 구간의 상한을 계산하기 위해 오차 한계를 점 추정치에 더합니다. 신뢰 구간의 하한을 계산하기 위해 오차 한계를 점 추정치에서 뺍니다.

해석

모형의 각 항에 대한 모집단 계수의 추정치를 평가하려면 신뢰 구간을 사용합니다.

예를 들어, 95% 신뢰 수준에서 신뢰 구간에 모집단에 대한 계수 값이 포함된다고 95% 확신할 수 있습니다. 신뢰 구간은 결과의 실제 유의성을 평가하는 데 도움이 됩니다. 해당 상황에 실제적으로 유의한 값이 신뢰 구간에 포함되는지 여부를 확인하려면 전문 지식을 활용하십시오. 신뢰 구간이 너무 넓어서 유의하지 않은 경우에는 표본 크기를 늘려보십시오.

Z-값

Z-값은 계수와 계수의 표준 오차 간의 비율을 측정하는 검정 통계량입니다. Z-값은 최대우도 추정 방법을 사용할 때 표시됩니다.

해석

Minitab에서는 항과 모형의 통계적 유의성에 대한 결정을 내릴 때 사용하는 p-값을 계산하기 위해 Z-값을 사용합니다.

0에서 충분히 떨어져 있는 Z-값은 계수 추정치가 0과 통계적으로 다를만큼 충분히 크고 정확함을 나타냅니다. 반대로, 0과 가까운 Z-값은 항이 반응에 영향을 미친다고 확신하기에는 계수가 너무 작거나 너무 부정확함을 나타냅니다.

p-값 – 계수

p-값은 귀무 가설에 반하는 증거를 측정하는 확률입니다. p-값이 작을수록 귀무 가설에 반하는 더 강력한 증거가 됩니다.

해석

계수가 0과 통계적으로 다르다는 증거를 제공하는지 여부를 확인하려면 항에 대한 p-값을 유의 수준과 비교하여 귀무 가설을 평가하십시오. 귀무 가설은 계수가 0으로, 항과 반응 간에 연관성이 없다는 것을 나타냅니다.

일반적으로 0.05의 유의 수준(α 또는 알파로 표시함)이 적절합니다. 0.05의 유의 수준은 계수가 0이 아닌데 0이라는 결론을 내릴 위험이 5%라는 것을 나타냅니다.

p-값 ≤ α: 연관성이 통계적으로 유의합니다.
p-값이 유의 수준보다 작거나 같으면 반응 변수와 항 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 있습니다.
p-값 > α: 연관성이 통계적으로 유의하지 않습니다.
p-값이 유의 수준보다 크면 반응 변수와 항 간에 통계적으로 유의한 연관성이 있다는 결론을 내릴 수 없습니다. 항 없이 모형을 다시 적합시킬 수도 있습니다.
반응과 통계적으로 유의한 연관성이 없는 예측 변수가 여러 개 있는 경우 한 번에 하나씩 항을 줄여 모형을 축소할 수 있습니다. 모형에서 항을 제거하는 방법은 모형 축소에서 확인하십시오.
계수가 통계적으로 유의한 경우 해석은 항의 유형에 따라 다릅니다. 해석은 다음과 같습니다.
요인
요인에 대한 계수가 통계적으로 유의하면 요인에 대한 계수가 0이 아니라는 결론을 내릴 수 있습니다.
요인 간의 교호작용
교호작용 항에 대한 계수가 통계적으로 유의하면 요인과 반응의 관계가 항의 다른 요인에 따라 다르다는 결론을 내릴 수 있습니다.
공변량
공변량에 대한 계수가 통계적으로 유의하면 반응과 공변량 간의 연관성이 통계적으로 유의하다는 결론을 내릴 수 있습니다.
블럭
블럭에 대한 계수가 통계적으로 유의하면 해당 블럭의 반응 값 평균이 반응의 전체 평균과 다르다는 결론을 내릴 수 있습니다.
중앙점
중앙점에 대한 계수가 통계적으로 유의하면 요인 중 하나 이상과 반응의 관계가 곡선 형태라는 결론을 내릴 수 있습니다. 곡면성을 모형화할 수 있도록 설계에 축 점을 추가할 수 있습니다.

VIF

분산 팽창 인수(VIF)는 계수의 분산이 모형 내 예측 변수 간의 상관 관계로 인해 얼마나 팽창되는지 나타냅니다.

해석

VIF를 사용하여 모형에 다중 공선성(예측 변수 사이의 상관)이 얼마나 있는지 설명합니다. 대부분의 요인 설계에서는 모든 VIF 값이 1이며, 이는 예측 변수에 다중 공선성이 없음을 나타냅니다. 다중 공선성이 없으면 통계적 유의성을 쉽게 확인할 수 있습니다. 모형에 공변량을 포함하거나 데이터를 수집하는 동안 변형된 런이 발생하는 경우 일반적으로 VIF 값이 증가하며, 이 경우 통계적 유의성을 해석하기 어렵습니다. 또한 이항 반응의 경우에는 VIF 값이 보통 1보다 큽니다.

VIF를 해석하려면 다음 지침을 사용하십시오.
VIF 예측 변수의 상태
VIF = 1 상관되지 않음
1 < VIF < 5 적당히 상관됨
VIF > 5 많이 상관됨
많이 상관된 예측 변수는 다중 공선성이 회귀 계수의 분산을 증가시킬 수 있기 때문에 문제가 있습니다. 다음은 불안정적인 계수의 일부 결과입니다.
  • 예측 변수와 반응 간에 중요한 관계가 존재하는 경우에도 계수가 통계적으로 유의하지 않은 것으로 보일 수 있습니다.
  • 높은 상관 관계가 있는 예측 변수에 대한 계수는 표본에 따라 크게 달라질 수 있습니다.
  • 높은 상관 관계가 있는 모형 항을 제거하면 높은 상관 관계가 있는 다른 항의 추정 계수에 크게 영향을 미칩니다. 높은 상관 관계가 있는 항의 계수로 인해 효과의 방향이 변경될 수도 있습니다.

다중 공선성이 존재하는 경우 모형에서 통계적 유의성을 사용하여 모형에서 제거할 항을 선택할 때 주의해야 합니다. 한 번에 하나의 항만 모형에 추가하거나 삭제하십시오. 모형을 변경함에 따라 모형 요약 통계량의 변동뿐만 아니라 통계적 유의성의 검정도 모니터링하십시오.