Méthodes et formules pour les statistiques d'adéquation de l'ajustement dans Ajuster le modèle de régression

Sélectionnez la méthode ou la formule de votre choix.

S

Notation

TermeDescription
CA MOY ERRcarré moyen de l'erreur

R carré

Le R2 est également appelé coefficient de détermination.

Formule

Notation

TermeDescription
yi ie valeur de réponse observée
réponse moyenne
ie réponse ajustée

R carré (ajusté)

Minitab affiche zéro lorsque les calculs de R2 ajusté génèrent des valeurs négatives.

Notation

TermeDescription
ie valeur de réponse observée
ième réponse ajustée
réponse moyenne
nnombre d'observations
pnombre de termes dans le modèle

R carré (prév)

Minitab affiche zéro lorsque les calculs de R2 (prév) génèrent des valeurs négatives.

Notation

TermeDescription
yi ie valeur de réponse observée
réponse moyenne
n nombre d'observations
ei ie valeur résiduelle
hi ie élément sur la diagonale de X(X'X)–1X'
X matrice du plan

PRESS

Evalue la capacité de prévision de votre modèle et est calculé de la manière suivante :

Notation

TermeDescription
nnombre d'observations
eiie valeur résiduelle
hi

ie élément diagonal de

X (X' X)-1X'

S de test

Le S de test résume la distance entre les valeurs de données et les valeurs ajustées dans l'ensemble de données de test. Le S de test est mesuré dans les unités de la réponse.

Formule

.

Pour la régression,

et pour la régression pondérée

.

Notation

TermeDescription
number of rows in the test data set
ie observed response value in the test data set
ie fitted value for the response in the test data set
weight for the ie observation in the test data set

R carré de test

Le R2 de test est le pourcentage de variation de la variable de réponse de l'ensemble de données de test expliqué par le modèle. La valeur du R2 de test se situe entre 0 % et 100 %. (Alors que les calculs pour le R2 de test peuvent produire des valeurs négatives, Minitab Statistical Software affiche 0 pour ces cas.)

Formule

où pour la régression

et pour la régression pondérée

.

La formule de la somme totale des carrés dépend également de l'inclusion ou non de pondérations dans les données. Pour la régression,

et pour la régression pondérée

Notation

TermeDescription
number of rows in the test data set
ie observed response value in the test data set
ie fitted value for the response in the test data set
weight for the ie observation in the test data set
mean of the response for the test data set
weighted mean of the response for the test data set

S de K ensembles

Le S de K ensembles résume la distance entre les valeurs de données et les valeurs ajustées dans l'ensemble de données de test. Le S de K ensembles est mesuré dans les unités de la réponse.

Formule

.

Pour la régression,

et pour la régression pondérée

.

Notation

TermeDescription
number of rows in fold j
ie observed response value in fold j
ie cross-validated fitted value for the response in fold j
Knumber of folds
wiweight for the ie observation in fold j

R carré de K ensembles

Le R2 de K ensembles est le pourcentage de variation de la variable de réponse des ensembles de données expliqués par le modèle. La valeur du R2 de K ensembles se situe entre 0 % et 100 %. (Alors que les calculs pour le R2 de K ensembles peuvent produire des valeurs négatives, Minitab Statistical Software affiche 0 pour ces cas.)

Formule

Minitab calcule la somme des carrés pour l'erreur pour chaque ensemble. Ces calculs utilisent les mêmes termes de modèle pour chaque ensemble, mais les estimations des coefficients peuvent différer. Pour calculer la statistique de R2 de K ensembles, additionnez les sommes des carrés pour l'erreur des différents ensembles. Pour la régression

et pour la régression pondérée

.

Ensuite, la formule suivante donne l'équation pour le R2 de K ensembles :

Notation

TermeDescription
number of rows without missing values for the response or missing values for the predictors that form the candidate terms in the model
ie observed response value in fold j
ie cross-validated fitted value for the response in fold j
Knumber of folds
wijweight for the ie observation in fold j
SSTotaltotal sum of squares for all of the data

R carré pas à pas de K ensembles

Le R carré pas à pas de K ensembles évalue le nombre de termes dans un modèle à partir d'un ensemble de termes candidats. Minitab affiche des valeurs négatives pour le R carré pas à pas de K ensembles quand ils se produisent.

Formule

Minitab calcule le R carré pas à pas de K ensembles lorsque la méthode de sélection pas à pas est la sélection ascendante avec validation et lorsque la méthode de validation est la validation croisée de K ensembles. Minitab effectue la sélection ascendante K fois, en omettant les données pour chaque ensemble une fois. Le modèle pour chaque ensemble peut être différent. Une fois les procédures de sélection ascendante terminées, Minitab additionne les erreurs carrées pour tous les ensembles à chaque étape. Minitab utilise cette somme pour calculer le R carré pas à pas de K ensembles. Pour la régression :

et pour la régression pondérée :

Ensuite, la formule suivante donne la valeur de R2 pas à pas de K ensembles pour une étape.

Notation

TermeDescription
number of rows without missing values for the response or missing values for the predictors that form the candidate terms in the model
ie observed response value in fold j
ie cross-validated fitted value for the response in fold j
Knumber of folds
wijweight for the ie observation in fold j
SSTotaltotal sum of squares for all of the data

Log de vraisemblance

Pour les analyses non pondérées, Minitab utilise l'équation suivante :
Pour une analyse où les observations sont pondérées, Minitab utilise l'équation suivante :

Les observations dont la pondération est de 0 ne sont pas dans l'analyse.

Notation

TermeDescription
nnombre d'observations
Rsomme des carrés de l'erreur pour le modèle
wipondération pour l'ie observation

AICc (critère d'information d'Akaike corrigé)

La valeur AICc n'est pas calculée quand .

Notation

TermeDescription
nnombre d'observations
pnombre de coefficients dans le modèle, constante incluse

BIC (critère d'information bayésien)

Notation

TermeDescription
pnombre de coefficients dans le modèle, constante incluse
nnombre d'observations

Cp de Mallows

Notation

TermeDescription
SCEpsomme des carrés de l'erreur pour le modèle examiné
CMEmcarré moyen de l'erreur pour le modèle incluant tous les termes candidats
nnombre d'observations
pnombre de termes dans le modèle, constante incluse
En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu.  Lisez notre politique