Terme | Description |
---|---|
valeur ajustée | |
xk | ke terme. Chaque terme peut être un prédicteur unique, un terme polynomial ou un terme d'interaction. |
bk | estimation du ke coefficient de régression |
L'erreur type de la valeur ajustée dans un modèle de régression avec un prédicteur est calculée comme suit :
L'erreur type de la valeur ajustée dans un modèle de régression avec plusieurs prédicteurs est calculée comme suit :
Pour la régression pondérée, inclure la matrice de poids dans l’équation:
Lorsque les données disposent d’un ensemble de données de test ou d’une validation croisée Buplé, les formules sont les mêmes. La valeur de s2 provient des données de formation. La matrice de conception et la matrice de poids proviennent également des données de formation.
Terme | Description |
---|---|
s2 | mean square error |
n | number of observations |
x0 | new value of the predictor |
mean of the predictor | |
xi | ie predictor value |
x0 | vector of values that produce the fitted values, one for each column in the design matrix, beginning with a 1 for the constant term |
X0 | transpose of the new vector of predictor values |
X | design matrix |
W | weight matrix |
Terme | Description |
---|---|
yi | ie valeur de réponse observée |
ie valeur ajustée pour la réponse |
Les valeurs résiduelles normalisées sont également appelées "valeurs résiduelles studentisées en interne".
Terme | Description |
---|---|
ei | ie valeur résiduelle |
hi | ie élément sur la diagonale de X(X'X)–1X' |
s2 | carré moyen de l'erreur |
X | matrice du plan |
X' | transposition de la matrice de plan |
Egalement appelées valeurs résiduelles studentisées de manière externe. La formule estla suivante :
Voici une autre présentation possible de la formule :
Le modèle qui effectue l'estimation de l'ie observation omet cette dernière dans l'ensemble de données. Par conséquent, l'ie observation ne peut pas influencer l'estimation. Chaque valeur résiduelle supprimée suit une loi de Student avec degrés de liberté.
Terme | Description |
---|---|
ei | ie valeur résiduelle |
s(i)2 | carré moyen de l'erreur calculé sans l'ie observation |
hi | ie élément sur la diagonale de X(X'X)–1X' |
n | nombre d'observations |
p | nombre de termes, constante incluse |
SCE | somme des carrés de l'erreur |
Intervalle dans lequel la réponse moyenne estimée d'un ensemble de valeurs de prédicteurs est censée se trouver. L'intervalle est défini par une limite inférieure et une limite supérieure, calculées par Minitab à partir du niveau de confiance et de l'erreur type des valeurs ajustées.
où
Terme | Description |
---|---|
α | valeur alpha choisie |
n | nombre d'observations |
p | nombre de paramètres |
s2 | carré moyen de l'erreur |
s2{b} | matrice de variance/covariance des coefficients |
Etendue de valeurs dans laquelle la réponse prévue pour une nouvelle observation a de fortes chances de se trouver. L'intervalle est défini par une limite inférieure et une limite supérieure, calculées par Minitab à partir du niveau de confiance et de l'erreur type de la prévision. L'intervalle de prévision est toujours plus large que l'intervalle de confiance car la prévision d'une seule réponse comporte un plus grand degré d'incertitude que la prévision d'une réponse moyenne.
La formule est la suivante : 0+ t(1 -α /2; n - p) s(pred)
Terme | Description |
---|---|
α | valeur alpha choisie |
n | nombre d'observations |
p | nombre de prédicteurs |
s (pred) |