Méthodes et formules pour les valeurs ajustées et les valeurs résiduelles dans la fonction Analyser un plan de criblage définitif

Valeur ajustée

Notation

TermeDescription
valeur ajustée
xkke terme. Chaque terme peut être un prédicteur unique, un terme polynomial ou un terme d'interaction.
bkestimation du ke coefficient de régression

Erreur type de la valeur ajustée (ErT ajust)

L'erreur type de la valeur ajustée dans un modèle de régression avec un prédicteur est calculée comme suit :

L'erreur type de la valeur ajustée dans un modèle de régression avec plusieurs prédicteurs est calculée comme suit :

Pour la régression pondérée, inclure la matrice de poids dans l’équation:

Lorsque les données disposent d’un ensemble de données de test ou d’une validation croisée Buplé, les formules sont les mêmes. La valeur de s2 provient des données de formation. La matrice de conception et la matrice de poids proviennent également des données de formation.

Notation

TermeDescription
s2mean square error
nnumber of observations
x0new value of the predictor
mean of the predictor
xiie predictor value
x0 vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
X0transpose of the new vector of predictor values
Xdesign matrix
Wweight matrix

Valeurs résiduelles

Une valeur résiduelle est la différence entre une valeur observée et la valeur ajustée correspondante. Cette partie de l'observation n'est pas expliquée par le modèle. La valeur résiduelle d'une observation est la suivante :

Notation

TermeDescription
yiie valeur de réponse observée
ie valeur ajustée pour la réponse

Valeur résiduelle normalisée (Val. résid. norm)

Les valeurs résiduelles normalisées sont également appelées "valeurs résiduelles studentisées en interne".

Formule

Notation

TermeDescription
ei ie valeur résiduelle
hi ie élément sur la diagonale de X(X'X)–1X'
s2 carré moyen de l'erreur
Xmatrice du plan
X'transposition de la matrice de plan

Valeurs résiduelles supprimées (studentisées)

Egalement appelées valeurs résiduelles studentisées de manière externe. La formule estla suivante :

Voici une autre présentation possible de la formule :

Le modèle qui effectue l'estimation de l'ie observation omet cette dernière dans l'ensemble de données. Par conséquent, l'ie observation ne peut pas influencer l'estimation. Chaque valeur résiduelle supprimée suit une loi de Student avec degrés de liberté.

Notation

TermeDescription
eiie valeur résiduelle
s(i)2carré moyen de l'erreur calculé sans l'ie observation
hi ie élément sur la diagonale de X(X'X)–1X'
nnombre d'observations
pnombre de termes, constante incluse
SCEsomme des carrés de l'erreur

Intervalle de confiance

Etendue de valeurs dans laquelle la réponse moyenne estimée d'un ensemble de valeurs de prédicteurs devrait se trouver.

Formule

Notation

TermeDescription
valeur de réponse ajustée pour un ensemble donné de valeurs de prédicteurs
αtaux d'erreur de type I
nnombre d'observations
pnombre de paramètres de modèle
S 2(b)matrice de variance/covariance des coefficients
s 2carré moyen de l'erreur
Xmatrice du plan
X0vecteur de valeurs de prédiction données avec une colonne et p lignes
X'0transposition du nouveau vecteur des valeurs de prédiction avec une ligne et p colonnes

Intervalle de prévision

L'intervalle de prévision est l'étendue dans laquelle on s'attend à trouver la réponse ajustée pour une nouvelle observation.

Formule

Notation

TermeDescription
s(Prév)
valeur de réponse ajustée pour un ensemble donné de valeurs de prédicteurs
αseuil de signification
nnombre d'observations
pnombre de paramètres de modèle
s 2carré moyen de l'erreur
Xmatrice de prédicteur
X0vecteur de valeurs de prédiction données avec une colonne et p lignes
X'0transposition du nouveau vecteur des valeurs de prédiction avec une ligne et p colonnes