이항 적합선 그림에 대한 그래프

그래프에 대한 정의 및 해석 방법을 확인해 보십시오.

이항 적합선 그림

적합선 그림에는 반응과 예측 변수 데이터가 표시됩니다. 그림에는 회귀 방정식을 나타내는 회귀선이 포함됩니다. 그림에 적합치에 대한 신뢰 구간을 표시할 수도 있습니다.

해석

반응 변수와 예측 변수 간의 관계를 조사하려면 적합선 그림을 사용합니다.

이 결과에서는 방정식이 성공 확률로 표시됩니다. y-축의 반응 값 1이 성공을 나타냅니다. 그림은 온도가 증가함에 따라 성공 확률이 감소한다는 것을 보여줍니다. 데이터에서 온도가 50에 가까운 경우 선의 기울기가 아주 크지 않으며, 이는 온도가 증가함에 따라 확률이 감소한다는 것을 나타냅니다. 온도 데이터의 중간 부분에서 선이 가파르며, 이는 1도의 온도 변화가 이 범위에서 더 큰 영향을 미친다는 것을 나타냅니다. 온도 범위의 상단 부분에서 성공 확률이 0에 가까워지면 선이 다시 평평해집니다.

모형이 데이터를 잘 적합하는 경우 높은 예측 확률은 사건이 일반적인 위치를 보여줍니다. 데이터에서 온도가 50에 가까우면 반응 값 1이 가장 일반적입니다. 온도가 증가하면 반응 값 0이 더 일반적이 됩니다.

그림에 신뢰 수준을 추가하면 구간을 사용하여 적합치의 추정치가 얼마나 정확한지 평가할 수 있습니다. 아래의 첫 번째 그림에서 신뢰 구간에 대한 선의 너비는 예측 변수가 증가함에 따라 거의 같습니다. 두 번째 그림에서는 예측 변수의 값이 증가함에 따라 신뢰 구간이 더 넓어집니다. 구간이 넓은 것은 부분적으로 온도가 높을 때 데이터의 양이 적기 때문입니다.

잔차 히스토그램

편차 잔차의 히스토그램은 모든 관측치에 대한 잔차 분포를 보여줍니다.

해석

데이터가 특정 방향으로 치우쳐 있는지 또는 데이터에 특이치가 포함되어 있는지 확인하려면 잔차 히스토그램을 사용하십시오. 다음 표의 패턴들은 모형이 모형 가설을 충족하지 않음을 나타낼 수 있습니다. 모형이 가정을 충족하지 않는 경우 예측에 대한 정규 근사 신뢰 구간이 부정확할 수 있습니다.
패턴 패턴이 나타내는 내용
한 쪽 방향의 긴 꼬리 왜도
다른 막대들과 멀리 떨어져 있는 막대 특이치

히스토그램 모양은 데이터를 그룹으로 나누는 데 사용된 구간 수에 따라 다르므로, 히스토그램을 사용하여 잔차의 정규성을 평가하지 마십시오. 그 대신 정규 확률도를 사용하십시오.

잔차의 정규 확률도

잔차의 정규 확률도는 분포가 정규 분포일 때 잔차 대 잔차의 기대값을 표시합니다.

해석

잔차가 정규 분포를 따른다는 가정을 확인하려면 잔차의 정규 확률도를 사용하십시오. 잔차의 정규 확률도는 대략 직선을 따라야 합니다.

다음 패턴은 잔차가 정규 분포를 따른다는 가정에 위배되는 경우입니다.

S-곡선은 긴 꼬리를 갖는 분포를 의미합니다.

역 S-곡선은 짧은 꼬리를 갖는 분포를 의미합니다.

하향 곡선은 오른쪽으로 치우친 분포를 의미합니다.

선으로부터 멀리 떨어져 있는 몇 개의 점은 특이치를 갖는 분포를 암시합니다.

비정규 패턴이 있으면 다른 잔차 그림을 사용하여 모형에 항 누락 또는 시간 순서 효과와 같은 다른 문제가 있는지 확인하십시오. 잔차가 정규 분포를 따르지 않을 경우 정규 근사 신뢰 구간과 Wald 검정 p-값이 정확하지 않을 수 있습니다.

잔차 대 적합치

잔차 대 적합치 그림은 y-축에 잔차, x-축에 적합치를 표시합니다. 그림은 데이터가 사건/시행 형식일 때 의미가 있습니다. 데이터가 이항 반응/빈도 형식인 경우 Minitab에서는 이 그림을 제공하지 않습니다.

해석

잔차가 랜덤하게 분포되어 있다는 가정을 확인하려면 잔차 대 적합치 그림을 사용하십시오. 이상적으로는 점들이 식별 가능한 패턴 없이 0의 양쪽에 랜덤하게 분포해야 합니다.

다음 표의 패턴들은 모형이 모형 가설을 충족하지 않음을 나타낼 수 있습니다.
패턴 패턴이 나타내는 내용
적합치에 대해 잔차가 부채꼴 모양으로 흩어져 있거나 고르지 않게 퍼져 있음 부적절한 연결 함수
곡선 고차 항 누락 또는 부적절한 연결 함수
한 점이 0에서 멀리 떨어져 있음 특이치
다른 점에서 x 방향으로 멀리 떨어져 있는 점 영향력 있는 점
다음 그래프는 특이치 및 잔차의 분산이 일정하다는 가정의 위반을 보여줍니다.
특이치가 있는 그래프

점 중 하나가 나머지 모든 점보다 훨씬 더 큽니다. 따라서 그 점이 특이치입니다. 특이치가 너무 많으면 모형이 적절하지 않을 수 있습니다. 특이치의 원인을 식별해야 합니다. 모든 데이터 입력 또는 측정 오류를 수정하십시오. 비정상적인 일회성 사건과 연관된 데이터 값을 삭제해 보십시오(특수 원인). 그런 다음 분석을 반복하십시오.

일정하지 않은 분산이 있는 그림

잔차의 분산이 적합치에 따라 증가합니다. 적합치가 증가하면 잔차 간의 산포가 더 넓어집니다. 이 패턴은 잔차의 분산이 동일하지(일정하지) 않다는 것을 나타냅니다.

잔차 대 적합치 그림에서 패턴이나 특이치를 찾은 경우 다음 방법을 사용해 보십시오.
문제 가능한 해결 방법
일정하지 않은 분산 모형의 다른 항, 다른 연결 함수 또는 가중치를 사용하는 것을 고려해 보십시오.
특이치 또는 영향력 있는 점
  1. 관측치가 측정 오류 또는 데이터 입력 오류인지 확인하십시오.
  2. 이 관측치 없이 분석을 수행하여 결과에 어떤 영향을 미치는지 살펴보십시오.

잔차 대 순서

잔차 대 순서 그림은 잔차를 데이터가 수집된 순서대로 표시합니다.

해석

잔차가 서로 독립적이라는 가정을 확인하려면 잔차 대 순서 그림을 사용하십시오. 독립 잔차는 시간순으로 표시될 때 아무런 추세나 패턴을 보이지 않습니다. 점들의 패턴은 서로 가까이 있는 잔차가 상관되어 있으며, 따라서 독립적이 아닐 수도 있음을 나타냅니다. 이상적으로는 그림의 잔차들이 중심선 주위에 랜덤하게 분포해야 합니다.
패턴이 있으면 원인을 조사하십시오. 다음 유형의 패턴은 잔차가 종속적이라는 것을 나타낼 수도 있습니다.
추세
이동
주기

잔차 대 변수

잔차 대 변수 그림은 잔차 대 다른 변수를 표시합니다. 변수가 이미 모형에 포함되어 있을 수 있습니다. 또는 변수가 모형에 포함되어 있지 않을 수도 있지만 반응에 영향을 미칠 것으로 예상됩니다.

해석

잔차에 랜덤하지 않은 패턴이 있으면 변수가 체계적으로 반응에 영향을 미친다는 것을 나타냅니다. 이 변수를 분석에 포함하는 것을 고려해 보십시오.