일반 선형 모형 적합에 대한 방법 표

방법 표의 모든 통계량에 대한 정의 및 해석 방법을 확인해 보십시오.

이 항목의 내용

요인 정보
요인 코드화
공변량 표준화
추정된 λ
λ에 대한 95% CI
반올림한 λ

요인 정보

요인 정보 표에는 설계 요인, 요인 유형, 수준 수 및 수준의 값이 표시됩니다.

요인은 실험에서 제어하는 변수입니다. 요인은 독립 변수, 설명 변수, 예측 변수라고도 합니다. 요인은 요인 수준이라고 하는, 제한된 수의 값을 가질 수 있습니다. 요인은 텍스트 또는 숫자 값을 취할 수 있습니다. 숫자 요인은 많은 값을 사용할 수 있더라도 제어된 값 몇 개만 실험에서 사용합니다.

해석

원하는 분석을 수행했는지 확인하려면 요인 정보 표를 사용하십시오.

일반 선형 모형에서 요인은 고정 요인이거나 변량 요인입니다. 일반적으로 조사자가 수준을 제어하는 요인은 고정 요인입니다. 반면, 조사자가 모집단에서 요인 수준을 랜덤하게 표본으로 추출하는 경우에는 랜덤 요인입니다.

예를 들어, 한 품질 분석가가 제조 공정에서 플라스틱 강도에 영향을 미칠 수 있는 요인을 연구하려고 합니다. 이 품질 분석가는 첨가제, 온도, 조작자를 실험에 포함합니다. 첨가제는 범주형 변수로, 유형 A 또는 유형 B입니다. 온도는 계량형 변수이지만, 품질 분석가는 100°C, 150°C, 200°C 등 세 가지 온도 설정만 실험에 포함하려고 합니다. 품질 분석가가 실험에서 이 두 요인의 수준을 제어하기 때문에 이 요인들은 모두 고정 요인입니다. 반면에, 품질 분석가는 공장 모집단에서 조작자를 랜덤하게 선택하기로 합니다. 따라서 조작자는 랜덤 요인입니다.

요인	첨가제	온도	조작자
유형	고정	고정	랜덤
수준	A	낮음(100°C)	A
수준	B	중간(150°C)	B
수준		높음(200°C)	C

요인은 교차 또는 내포 요인일 수 있습니다. 한 요인의 각 수준이 다른 요인의 각 수준과 조합되어 발생하는 경우, 두 요인은 교차되어 있습니다. 한 요인의 수준들이 비슷하지만 동일하지는 않고 각 수준이 다른 요인의 여러 수준과 조합되어 발생하는 경우, 두 요인은 내포되어 있습니다.

예를 들어, 설계에 기계와 조작자가 포함된 경우 모든 조작자가 모든 기계를 사용하면 이 요인들은 교차 요인입니다. 그러나 각 기계를 서로 다른 조작자들이 사용할 경우 조작자가 기계에 내포됩니다.

요인 정보 표에서 괄호는 내포된 요인을 나타냅니다. 예를 들어, 조작자(기계)는 조작자가 기계에 내포되어 있음을 나타냅니다.

자세한 내용은 요인 및 요인 수준, 요인, 교차 요인 및 내포 요인의 정의 및 고정 요인과 변량 요인의 차이에서 확인하십시오.

요인 코드화

Minitab에서는 모형에 범주형 변수를 포함하기 위해 (0, 1) 또는 (−1, 0, +1) 코드화 방법을 사용할 수 있습니다. 회귀 분석의 경우 (0, 1) 방법이 기본값이며 분산 분석 및 실험계획법의 경우 (−1, 0, +1) 방법이 기본값입니다. 두 가지 방법 중 어느 것을 선택해도 범주형 변수의 통계적 유의성은 변경되지 않습니다. 그러나 코드화 방법에 따라 계수 및 계수 해석 방법이 달라집니다.

해석

원하는 분석을 수행했는지 확인하려면 표시되는 코드화 방법을 확인하십시오. 다음과 같이 범주형 변수에 대한 계수를 해석하십시오.

(0, 1) 코드화 방법의 경우, 각 계수는 각 수준 평균과 기준 수준 평균 간의 차이를 나타냅니다. 기준 수준에 대한 계수는 계수 표에 표시되지 않습니다.
(−1, 0,+1) 코드화 방법의 경우, 각 계수는 각 수준 평균과 전체 평균 간의 차이를 나타냅니다.

공변량 표준화

모형의 공변량을 표준화하기로 선택한 경우 Minitab에서는 공변량 표준화 표의 방법에 대한 세부 정보를 제공합니다.

일반적으로 변수를 중심화하거나 변수의 척도를 지정하기 위해 또는 둘 다에 표준화를 사용합니다. 변수를 중심화하는 경우 다항식 항 및 교호작용 항에 의해 야기되는 다중 공선성을 줄이고, 이에 따라 계수 추정치의 정밀도가 개선됩니다. 대부분의 경우 변수 척도를 지정하면 Minitab에서 변수의 서로 다른 척도를 공통 척도로 변환하므로, 계수 크기를 비교할 수 있습니다.

해석

원하는 분석을 수행했는지 확인하려면 표준화 방법 표를 사용하십시오. 선택한 방법에 따라 계수 해석을 다음과 같이 변경해야 합니다.

코드화할 낮은 수준과 높은 수준을 -1과 +1로 지정: 이 방법은 변수를 중심화하는 동시에 변수의 척도를 지정합니다. Minitab은 실험 설계(DOE)에 이 방법을 사용합니다. 계수는 사용자가 지정한 높은 값 및 낮은 값과 연관된 반응의 평균 변화를 나타냅니다.
평균값을 뺀 후 표준 편차로 나누기: 이 방법은 변수를 중심화하는 동시에 변수의 척도를 지정합니다. 각 계수는 변수의 1 표준 편차 변화에 대한 반응의 예상되는 변화를 나타냅니다.
평균값 빼기: 이 방법은 변수를 중심화합니다. 각 계수는 원래 측정 척도를 사용하여 변수의 한 단위 변화에 대한 반응의 예상되는 변화를 나타냅니다. 평균을 빼면 상수 계수가 모든 예측 변수가 평균 값일 때 평균 반응을 추정합니다.
표준 편차로 나누기: 이 방법은 변수 척도를 지정합니다. 각 계수는 변수의 1 표준 편차 변화에 대한 반응의 예상되는 변화를 나타냅니다.
지정된 값을 뺀 후 다른 값으로 나누기: 이 방법의 효과 및 해석은 입력하는 값에 따라 달라집니다.

추정된 λ

Box-Cox 변환을 사용하는 경우 추정된 λ(람다)는 정규 분포를 따르는 반응 값을 생성하기 위한 최적값입니다. 기본적으로 Minitab에서는 반올림한 람다 값을 사용합니다.

해석

람다는 Minitab에서 반응 값을 변환하기 위해 사용하는 지수입니다. 예를 들어, 람다 = -1이면 모든 반응 값(Y)이 다음과 같이 변환됩니다: Y^-1 = −1/Y. 람다 = 0이면 Y⁰이 아니라 Y의 자연 로그를 나타냅니다.

λ에 대한 95% CI

λ(람다)에 대한 신뢰 구간은 표본이 추출된 전체 모집단에 대한 λ의 실제 값이 포함될 가능성이 높은 값의 범위입니다.

표본이 랜덤이기 때문에 모집단의 두 표본에서 동일한 신뢰 구간이 생성될 가능성은 없습니다. 그러나 여러 개의 랜덤 표본을 추출하면 일정한 백분율의 신뢰 구간에는 알 수 없는 모집단 모수가 포함됩니다. 모수를 포함하는 이러한 신뢰 구간의 백분율이 해당 구간의 신뢰 수준입니다.

해석

표본에 대한 람다의 추정치를 평가하려면 신뢰 구간을 사용하십시오.

예를 들어, 95% 신뢰 수준에서 신뢰 구간에 모집단에 대한 람다 값이 포함된다고 95% 확신할 수 있습니다. 신뢰 구간은 결과의 실제 유의성을 평가하는 데 도움이 됩니다. 해당 상황에 실제적으로 유의한 값이 신뢰 구간에 포함되는지 여부를 확인하려면 전문 지식을 이용하십시오. 신뢰 구간이 너무 넓어서 유의하지 않은 경우에는 표본 크기를 늘려보십시오.

반올림한 λ

기본적으로 Minitab에서는 이 값이 보다 직관적인 변환에 해당하기 때문에 최적 λ(람다)를 가장 가까운 반으로 반올림합니다. 변환을 위한 최적값을 사용하려면 파일 > 옵션 > 선형 모형 > 결과 표시을 선택하십시오.

해석

일반적인 반올림 람다 값 및 이 값들이 반응 변수를 변환하는 방법은 다음과 같습니다.

람다	변환
-2	−Y^-2 = −1 / Y²
-1	−Y^-1 = −1 / Y
-0.5	−Y^-0.5 = −1 / (Y의 제곱근)
0	log (Y)
0.5	Y^0.5 = Y의 제곱근
1	Y
2	Y²