확정 선별 설계 분석의 적합치 및 잔차에 대한 방법 및 공식

적합치

용어	설명
	적합치
x_k	k번째 항. 각 항은 단일 예측 변수, 다항식 항 또는 교호작용 항입니다.
b_k	k번째 회귀 계수의 추정치

예측 변수가 하나인 회귀 모형 적합치의 표준 오차는 다음과 같습니다.

예측 변수가 두 개 이상인 회귀 모형 적합치의 표준 오차는 다음과 같습니다.

가중치 가중 회귀를 위해 방정식에 가중치 행렬을 포함합니다.

데이터에 테스트 데이터 집합 또는 K-fold 교차 유효성 검사가 있는 경우 수식은 동일합니다. 의 가치는 s도 ²는 학습 데이터에서 나온 것입니다. 설계 행렬과 웨이트 매트릭스도 학습 데이터에서 사용됩니다.

용어	설명
s²	mean square error
n	number of observations
x₀	new value of the predictor
	mean of the predictor
x_i	i^번째 predictor value
x₀	vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
x'₀	transpose of the new vector of predictor values
X	design matrix
W	weight matrix

잔차는 관측치와 해당 적합치의 차이입니다. 관측치의 이 부분은 모형에 의해 설명되지 않습니다. 관측치의 잔차는 다음과 같습니다.

용어	설명
y_i	i번째 관측 반응치
	반응에 대한 i번째 적합치

표준화 잔차는 "내적 스튜던트화 잔차"라고도 합니다.

외적 스튜던트화 잔차. 공식은 다음과 같습니다.

이 공식은 또한 다음과 같이 표시됩니다.

i번째 관측치를 추정하는 모형에서 데이터 집합의 i번째 관측치가 제외됩니다. 따라서 i번째 관측치는 추정치에 영향을 미치지 않습니다. 각 외적 스튜던트화 잔차에는 자유도가 인 t-분포가 있습니다.

주어진 예측 변수 값의 집합에 대해 추정된 평균 반응 값이 포함될 것으로 예상되는 범위.

예측 구간은 새 관측치에 대한 적합 반응이 포함될 것으로 예상되는 범위입니다.