Méthodes et formules pour les valeurs ajustées et les valeurs résiduelles dans la fonction Analyser un plan factoriel

Valeur ajustée

Notation

TermeDescription
valeur ajustée
xkke terme. Chaque terme peut être un prédicteur unique, un terme polynomial ou un terme d'interaction.
bkestimation du ke coefficient de régression

Valeurs résiduelles

Une valeur résiduelle est la différence entre une valeur observée et la valeur ajustée correspondante. Cette partie de l'observation n'est pas expliquée par le modèle. La valeur résiduelle d'une observation est la suivante :

Notation

TermeDescription
yiie valeur de réponse observée
ie valeur ajustée pour la réponse

Valeur résiduelle normalisée (Val. résid. norm)

Les valeurs résiduelles normalisées sont également appelées "valeurs résiduelles studentisées en interne".

Formule

Notation

TermeDescription
ei ie valeur résiduelle
hi ie élément sur la diagonale de X(X'X)–1X'
s2 carré moyen de l'erreur
Xmatrice du plan
X'transposition de la matrice de plan

Valeurs résiduelles supprimées (studentisées)

Egalement appelées valeurs résiduelles studentisées de manière externe. La formule estla suivante :

Voici une autre présentation possible de la formule :

Le modèle qui effectue l'estimation de l'ie observation omet cette dernière dans l'ensemble de données. Par conséquent, l'ie observation ne peut pas influencer l'estimation. Chaque valeur résiduelle supprimée suit une loi de Student avec degrés de liberté.

Notation

TermeDescription
eiie valeur résiduelle
s(i)2carré moyen de l'erreur calculé sans l'ie observation
hi ie élément sur la diagonale de X(X'X)–1X'
nnombre d'observations
pnombre de termes, constante incluse
SCEsomme des carrés de l'erreur

Valeurs résiduelles des sous-blocs

Part de l'observation due à la variation de sous-blocs (après prise en compte des termes du modèle) dans un plan en parcelles divisées.

Notation

TermeDescription
valeur ajustée pour le modèle complet (en incluant le terme d'erreur de sous-blocs et les termes fixes)
valeur ajustée calculée en utilisant uniquement les termes des effets fixes, et non le terme d'erreur de sous-blocs

Erreur type de la valeur ajustée (ErT ajust)

L'erreur type de la valeur ajustée dans un modèle de régression avec un prédicteur est calculée comme suit :

L'erreur type de la valeur ajustée dans un modèle de régression avec plusieurs prédicteurs est calculée comme suit :

Pour la régression pondérée, inclure la matrice de poids dans l’équation:

Lorsque les données disposent d’un ensemble de données de test ou d’une validation croisée Buplé, les formules sont les mêmes. La valeur de s2 provient des données de formation. La matrice de conception et la matrice de poids proviennent également des données de formation.

Notation

TermeDescription
s2mean square error
nnumber of observations
x0new value of the predictor
mean of the predictor
xiie predictor value
x0 vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term
X0transpose of the new vector of predictor values
Xdesign matrix
Wweight matrix

Erreur type des valeurs ajustées (ErT ajust) pour un plan en parcelles divisées

Les erreurs types des coefficients sont les racines carrées des éléments diagonaux de la matrice de covariance :
L'erreur type de la valeur ajustée à un point donné (utilisée pour les intervalles de confiance) est calculée comme suit :
L'erreur type utilisée dans les intervalles de prédiction est la suivante :

Notation

TermeDescription
composante de la variance de sous-parcelle, calculée comme CME(SP)
Xmatrice n × p du plan pour les effets de facteurs, les covariables, les blocs et le terme d'erreur de sous-bloc
composante de la variance de sous-bloc, qui a la formule suivante dans un plan équilibré :
mnombre de sous-parcelles dans un sous-bloc
Zmatrice n × w des indicateurs de sous-blocs (composée uniquement de 1 et de 0)
nNombre de lignes de données
pnombre de coefficients
wNombre de sous-blocs
xvecteur de ligne de niveaux de prédicteurs
matrice de covariance de β
βvecteur des coefficients

Intervalle de confiance

Etendue de valeurs dans laquelle la réponse moyenne estimée d'un ensemble de valeurs de prédicteurs devrait se trouver.

Formule

Notation

TermeDescription
valeur de réponse ajustée pour un ensemble donné de valeurs de prédicteurs
αtaux d'erreur de type I
nnombre d'observations
pnombre de paramètres de modèle
S 2(b)matrice de variance/covariance des coefficients
s 2carré moyen de l'erreur
Xmatrice du plan
X0vecteur de valeurs de prédiction données avec une colonne et p lignes
X'0transposition du nouveau vecteur des valeurs de prédiction avec une ligne et p colonnes

Intervalle de prévision

L'intervalle de prévision est l'étendue dans laquelle on s'attend à trouver la réponse ajustée pour une nouvelle observation.

Formule

Notation

TermeDescription
s(Prév)
valeur de réponse ajustée pour un ensemble donné de valeurs de prédicteurs
αseuil de signification
nnombre d'observations
pnombre de paramètres de modèle
s 2carré moyen de l'erreur
Xmatrice de prédicteur
X0vecteur de valeurs de prédiction données avec une colonne et p lignes
X'0transposition du nouveau vecteur des valeurs de prédiction avec une ligne et p colonnes