모형 선택 그림은 적합 또는 교차 검증된 성분 수에 따라 달라지는 R2 및 예측 R2 값의 산점도입니다. 이것은 모형 선택 및 검증표를 그래프로 나타낸 것입니다. 교차 검증을 사용하지 않으면 예측 R2 값이 그림에 표시되지 않습니다. Minitab은 반응 변수마다 모형 선택 그림을 하나씩 제공합니다.
이 그림을 사용하여 여러 가지 모형의 모형화 능력과 예측 능력을 비교하고 모형에 유지할 적절한 성분 수를 결정할 수 있습니다. 그림의 수직선은 Minitab이 PLS 모형에 대해 선택한 성분 수를 나타냅니다.
반응도는 적합치 대 실제 반응의 산점도입니다. 교차 검증을 수행하면 그림에 적합치 대 교차 검증된 적합치도 포함됩니다. Minitab에서는 반응 변수별로 반응도를 하나씩 제공합니다.
예측 능력이 우수한 모형은 일반적으로 기울기가 1이고 0에서 y-축이 교차합니다.
계수도는 각 예측 변수의 표준화되지 않은 계수를 보여주는 투영된 산점도입니다. Minitab은 반응 변수별로 계수도를 하나씩 제공합니다.
계수 그림을 회귀 계수의 출력과 함께 사용하여 각 예측 변수에 대한 계수의 부호와 크기를 비교할 수 있습니다. 이 그림을 사용하면 모형에서 예측 변수의 중요성을 신속하게 확인할 수 있습니다.
그림에는 표준화되지 않은 계수가 표시되기 때문에 예측 변수들의 척도가 같은 경우에만(예: 분광 데이터) 예측 변수와 반응 변수의 관계 크기를 비교할 수 있습니다. 예측 변수들의 척도가 같지 않으면 표준화 계수도를 사용하거나 적재 그림을 사용하여 성분 계산에 사용된 예측 변수의 중요성을 비교할 수 있습니다.
계수도는 각 예측 변수에 대해 표준화된 계수를 보여주는 투영된 산점도입니다. Minitab은 반응 변수별로 표준 계수도를 하나씩 제공합니다.
이 그림을 회귀 계수의 출력과 함께 사용하여 각 예측 변수에 대한 계수의 부호와 크기를 비교할 수 있습니다. 이 그림을 사용하면 모형에서 예측 변수의 중요성을 신속하게 확인할 수 있습니다.
그림에는 표준화된 계수가 표시되기 때문에 예측 변수들의 척도가 같지 않아도 예측 변수와 반응 변수 간의 관계 크기를 비교할 수 있습니다.
예측 변수들의 척도가 같으면 표준화된 그림과 표준화되지 않은 그림의 계수 패턴은 비슷하게 나타납니다. 그러나 예측 변수들의 깊은 상관 관계로 인한 일정하지 않은 계수와 표본 표준 편차와 모 표준 편차의 차이 때문에 두 그래프는 똑같지 않을 수 있습니다.
거리 그림은 x-모형 및 y-모형에서 각 관측치까지의 거리에 대한 산점도입니다. y-모형으로부터의 거리는 y-공간에서 관측치가 적합된 정도를 측정합니다. x-모형으로부터의 거리는 x-공간에서 관측치가 적합된 정도를 측정합니다.
이 그림을 검토할 때는 x-축이나 y-축에서의 거리가 다른 점들보다 큰 점을 살펴봐야 합니다. y-모형으로부터의 거리가 큰 관측치는 특이치일 수 있으며 x-모형으로부터의 거리가 큰 관측치는 레버리지 점일 수 있습니다.
표준화된 잔차 히스토그램은 모든 관측치에 대한 표준화 잔차 분포를 표시합니다.
패턴 | 패턴이 나타내는 내용 |
---|---|
한 쪽 방향의 긴 꼬리 | 왜도 |
다른 막대와 멀리 떨어져 있는 막대 | 특이치 |
히스토그램의 외양은 데이터를 그룹으로 나누는 데 사용된 구간 수에 따라 다르므로, 히스토그램을 사용하여 잔차의 정규성을 평가하지 마십시오. 그 대신 정규 확률도를 사용하십시오. 히스토그램은 데이터 점의 수가 약 20개 이상일 때 가장 효과적입니다. 표본이 너무 작으면 히스토그램의 각 막대에 왜도나 특이치를 높은 신뢰도로 보여주기에 충분한 데이터 점이 포함되지 않습니다.
잔차의 정규 확률도는 분포가 정규 분포일 때 표준화 잔차 대 잔차의 기대값을 표시합니다.
잔차가 정규 분포를 따른다는 가정을 확인하려면 잔차의 정규 확률도를 사용하십시오. 잔차의 정규 확률도는 대략 직선을 따라야 합니다.
비정규 패턴이 보이면 다른 잔차 그림을 사용하여 모형에 다른 문제(항 누락 또는 시간 순서 효과 등)가 있는지 확인하십시오. 잔차가 정규 분포를 따르지 않는 경우 신뢰 구간과 p-값이 정확하지 않을 수 있습니다.
잔차 대 적합치 그래프는 y-축에 표준화 잔차, x-축에 적합치를 표시합니다.
잔차가 랜덤하게 분포되어 있고 잔차의 분산이 일정하다는 가정을 확인하려면 잔차 대 적합치 그림을 사용하십시오. 이상적으로는 점들이 식별 가능한 패턴 없이 0의 양쪽에 랜덤하게 분포해야 합니다.
패턴 | 패턴이 나타내는 내용 |
---|---|
적합치에 대해 잔차가 부채꼴 모양으로 흩어져 있거나 고르지 않게 퍼져 있음 | 일정하지 않은 분산 |
곡선 | 고차 항 누락 |
한 점이 0에서 멀리 떨어져 있음 | 특이치 |
다른 점에서 x 방향으로 멀리 떨어져 있는 점 | 영향력 있는 점 |
잔차 대 레버리지 그림은 각 관측치의 표준화 잔차 대 레버리지에 대한 산점도입니다.
잔차 대 순서 그림은 표준화 잔차를 데이터가 수집된 순서대로 표시합니다.
점수 그림은 모형에 있는 첫 번째 및 두 번째 성분의 x-점수에 대한 산점도입니다.
처음 두 성분이 예측 변수의 분산을 대부분 설명하면 이 그림의 점 구성은 데이터의 원래 다차원 구성을 근접하게 나타냅니다. 모형에 의해 설명되는 예측 변수의 분산 양을 확인하려면 모형 선택 및 검증표에서 x-분산 값을 검토하십시오. x-분산 값이 크면 해당 모형이 예측 변수의 유의성 분산을 설명하고 있음을 나타냅니다.
모형에 성분이 2개보다 많이 포함된 경우 산점도를 사용하여 다른 성분의 x-점수를 표시할 수도 있습니다. 이렇게 하려면 x-점수 행렬을 저장한 다음 를 사용하여 행렬을 열에 복사하십시오. 모형에 성분이 하나만 있으면 이 그림은 출력에 표시되지 않습니다.
3D 점수 그림은 모형에 있는 첫 번째, 두 번째, 세 번째 성분의 x-점수에 대한 3차원 산점도입니다. 처음 세 성분이 예측 변수의 분산을 대부분 설명하면 이 그림의 점 구성은 데이터의 원래 다차원 구성을 근접하게 나타냅니다. 모형에 의해 설명되는 분산의 양을 확인하려면 모형 선택 및 검증표에서 x-분산 값을 검토하십시오. x-분산 값이 크면 해당 모형이 예측 변수의 유의성 분산을 설명하고 있음을 나타냅니다.
그림을 회전하여 여러 각도에서 그래프를 살펴보려면 3D 그래프 도구도 사용해야 합니다. 이 도구를 사용하면 데이터를 더욱 완전하게 파악할 수 있으며 레버리지 점과 점의 군집을 더 정확하게 확인할 수 있습니다.
적재 그림은 모형의 첫 번째 및 두 번째 성분에 투영된 예측 변수의 산점도입니다. 이 그림에는 첫 번째 성분의 x-적재에 대해 표시된 두 번째 성분의 x-적재가 표시됩니다. 예측 변수를 나타내는 각 점은 그림에서 (0,0)과 연결되어 있습니다.
적재 그림은 첫 번째 및 두 번째 성분에 대한 예측 변수의 중요도를 나타내며, 특히 예측 변수의 척도가 다른 경우에 유용합니다. 성분이 모형 선택 및 검증표에 표시된 x-분산의 대부분을 설명하는 경우, 적재 그림은 x-공간에서 예측 변수의 중요도를 나타냅니다. 전체 모형에서 예측 변수의 중요도를 고려하는 경우에는 반응 변수에서 성분이 설명하는 분산의 양도 고려해야 합니다. 이러한 경우를 확인하려면 모형 선택 및 검증표에서 R2 및 예측 R2 값을 검토하십시오.
모형에 성분이 2개보다 많이 포함된 경우 산점도를 사용하여 다른 성분의 x-적재를 표시할 수도 있습니다. 이렇게 하려면 x-적재 행렬을 저장한 다음 를 사용하여 행렬을 열에 복사하십시오.
잔차 X 그림은 x-잔차 대 예측 변수의 선 그림입니다. 각 선은 관측치를 나타내며 각 선에는 예측 변수 수만큼의 점이 있습니다.
x-잔차 산점도 행렬을 사용하여 모형이 잘 설명하지 못하는 예측 변수나 관측치를 확인할 수 있습니다. 이 그림은 예측 변수들의 척도가 같은 경우 가장 유용합니다.
x-잔차 산점도 행렬을 사용하여 잔차의 일반적인 패턴을 보고 문제가 있는 부분을 조사할 수 있습니다. 그런 다음 출력에 표시된 x-잔차를 조사하여 모형이 잘 설명하지 못하는 예측 변수와 관측치를 확인할 수 있습니다.
계산된 X 그림은 계산된 x-값 대 예측 변수의 선 그림입니다. 각 선은 관측치를 나타내며 각 선에는 예측 변수 수만큼의 점이 있습니다.
이 그림을 사용하여 모형이 잘 설명하지 못하는 예측 변수나 관측치를 확인할 수 있습니다. 이 그림은 예측 변수들의 척도가 같은 경우에 가장 유용합니다.
계산된 X 그림은 x-잔차 그림을 보완합니다. 두 그림을 합하면 원래 예측 변수 값의 그림이 됩니다. 원래 x-값보다 훨씬 작거나 큰 x-계산 값을 가진 예측 변수는 모형으로 잘 설명되지 않습니다.