확정 선별 설계 분석의 적합치 및 잔차에 대한 방법 및 공식

적합치

표기법

용어설명
적합치
xkk번째 항. 각 항은 단일 예측 변수, 다항식 항 또는 교호작용 항입니다.
bkk번째 회귀 계수의 추정치

적합치의 표준 오차(SE 적합치)

예측 변수가 하나인 회귀 모형 적합치의 표준 오차는 다음과 같습니다.

예측 변수가 두 개 이상인 회귀 모형 적합치의 표준 오차는 다음과 같습니다.

가중치 가중 회귀를 위해 방정식에 가중치 행렬을 포함합니다.

데이터에 테스트 데이터 집합 또는 K-fold 교차 유효성 검사가 있는 경우 수식은 동일합니다. 의 가치는 s2는 학습 데이터에서 나온 것입니다. 설계 행렬과 웨이트 매트릭스도 학습 데이터에서 사용됩니다.

표기법

용어설명
s2mean square error
nnumber of observations
x0new value of the predictor
mean of the predictor
xii번째 predictor value
x0 vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
x'0transpose of the new vector of predictor values
Xdesign matrix
Wweight matrix

잔차

잔차는 관측치와 해당 적합치의 차이입니다. 관측치의 이 부분은 모형에 의해 설명되지 않습니다. 관측치의 잔차는 다음과 같습니다.

표기법

용어설명
yii번째 관측 반응치
반응에 대한 i번째 적합치

표준화 잔차

표준화 잔차는 "내적 스튜던트화 잔차"라고도 합니다.

공식

표기법

용어설명
ei i번째 잔차
hi X(X'X)–1X'i번째 대각 원소
s 2 평균 제곱 오차
X설계 행렬
X'설계 행렬의 전치

외적 스튜던트화 잔차

외적 스튜던트화 잔차. 공식은 다음과 같습니다.

이 공식은 또한 다음과 같이 표시됩니다.

i번째 관측치를 추정하는 모형에서 데이터 집합의 i번째 관측치가 제외됩니다. 따라서 i번째 관측치는 추정치에 영향을 미치지 않습니다. 각 외적 스튜던트화 잔차에는 자유도가 인 t-분포가 있습니다.

표기법

용어설명
eii번째 잔차
s(i)2i번째 관측치를 포함하지 않고 계산한 평균 제곱 오차
hi X(X'X)–1X'i번째 대각 원소
n관측치 수
p항 수, 상수 포함
SSE오차의 제곱합

신뢰 구간

주어진 예측 변수 값의 집합에 대해 추정된 평균 반응 값이 포함될 것으로 예상되는 범위.

수식

표기법

용어설명
주어진 예측 변수 값의 집합에 대한 적합 반응 값
α제1종 오류율
n관측치 수
p모형 모수의 수
S 2(b)계수의 분산-공분산 행렬
s 2평균 제곱 오차
X설계 행렬
X01개 열과 p 행이 있는 지정된 예측 변수 값의 벡터
X'01개 행 및 p 열이 있는 예측 변수 값의 새 벡터 전치

예측 구간

예측 구간은 새 관측치에 대한 적합 반응이 포함될 것으로 예상되는 범위입니다.

수식

표기법

용어설명
s(예측)
주어진 예측 변수 값의 집합에 대한 적합 반응 값
α유의 수준
n관측치 수
p모형 모수의 수
s 2평균 제곱 오차
X예측 변수 행렬
X01개 열과 p 행이 있는 지정된 예측 변수 값의 벡터
X'01개 행 및 p 열이 있는 예측 변수 값의 새 벡터 전치