Méthodes et formules pour les statistiques de qualité de l’ajustement dans Ajuster le modèle de régression et Regressão Linear

Sélectionnez la méthode ou la formule de votre choix.

S

Notation

TermeDescription
CA MOY ERRcarré moyen de l'erreur

R carré

Le R2 est également appelé coefficient de détermination.

Formule

Notation

TermeDescription
yi ie valeur de réponse observée
réponse moyenne
ie réponse ajustée

R carré (ajusté)

Minitab affiche zéro lorsque les calculs de R2 ajusté génèrent des valeurs négatives.

Notation

TermeDescription
ie valeur de réponse observée
ième réponse ajustée
réponse moyenne
nnombre d'observations
pnombre de termes dans le modèle

R carré (prév)

Minitab affiche zéro lorsque les calculs de R2 (prév) génèrent des valeurs négatives.

Notation

TermeDescription
yi ie valeur de réponse observée
réponse moyenne
n nombre d'observations
ei ie valeur résiduelle
hi ie élément sur la diagonale de X(X'X)–1X'
X matrice du plan

PRESS

Evalue la capacité de prévision de votre modèle et est calculé de la manière suivante :

Notation

TermeDescription
nnombre d'observations
eiie valeur résiduelle
hi

ie élément diagonal de

X (X' X)-1X'

S de test

Le S de test résume la distance entre les valeurs de données et les valeurs ajustées dans l'ensemble de données de test. Le S de test est mesuré dans les unités de la réponse.

Formule

.

Pour la régression,

et pour la régression pondérée

.

Notation

TermeDescription
nombre de lignes dans l'ensemble de données de test
ie valeur de réponse observée dans l'ensemble de données de test
ie valeur ajustée pour la réponse dans l'ensemble de données de test
pondération pour la ie observation dans l'ensemble de données de test

R carré de test

Le R2 de test est le pourcentage de variation de la variable de réponse de l'ensemble de données de test expliqué par le modèle. La valeur du R2 de test se situe entre 0 % et 100 %. (Alors que les calculs pour le R2 de test peuvent produire des valeurs négatives, Minitab Statistical Software affiche 0 pour ces cas.)

Formule

où pour la régression

et pour la régression pondérée

.

La formule de la somme totale des carrés dépend également de l'inclusion ou non de pondérations dans les données. Pour la régression,

et pour la régression pondérée

Notation

TermeDescription
nombre de lignes dans l'ensemble de données de test
ie valeur de réponse observée dans l'ensemble de données de test
ie valeur ajustée pour la réponse dans l'ensemble de données de test
pondération pour la ie observation dans l'ensemble de données de test
moyenne de la réponse pour l'ensemble de données de test
moyenne pondérée de la réponse pour l'ensemble de données de test

S de K ensembles

Le S de K ensembles résume la distance entre les valeurs de données et les valeurs ajustées dans l'ensemble de données de test. Le S de K ensembles est mesuré dans les unités de la réponse.

Formule

.

Pour la régression,

et pour la régression pondérée

.

Notation

TermeDescription
nombre de lignes dans la partition j
Ie valeur de réponse observée dans la partition j
ie valeur ajustée à validation croisée pour la réponse dans la partition j
Knombre de partitions
wipondération pour la ie observation dans la partition j

R carré de K ensembles

Le R2 de K ensembles est le pourcentage de variation de la variable de réponse des ensembles de données expliqués par le modèle. La valeur du R2 de K ensembles se situe entre 0 % et 100 %. (Alors que les calculs pour le R2 de K ensembles peuvent produire des valeurs négatives, Minitab Statistical Software affiche 0 pour ces cas.)

Formule

Minitab calcule la somme des carrés pour l'erreur pour chaque ensemble. Ces calculs utilisent les mêmes termes de modèle pour chaque ensemble, mais les estimations des coefficients peuvent différer. Pour calculer la statistique de R2 de K ensembles, additionnez les sommes des carrés pour l'erreur des différents ensembles. Pour la régression

et pour la régression pondérée

.

Ensuite, la formule suivante donne l'équation pour le R2 de K ensembles :

Notation

TermeDescription
nombre de lignes sans valeurs manquantes pour la réponse ou valeurs manquantes pour les prédicteurs qui forment les termes candidats dans le modèle
Ie valeur de réponse observée dans la partition j
ie valeur ajustée à validation croisée pour la réponse dans la partition j
Knombre de partitions
wijpondération pour la ie observation dans la partition j
SomCartotalesomme totale des carrés pour toutes les données

R carré pas à pas de K ensembles

Le R carré pas à pas de K ensembles évalue le nombre de termes dans un modèle à partir d'un ensemble de termes candidats. Minitab affiche des valeurs négatives pour le R carré pas à pas de K ensembles quand ils se produisent.

Formule

Minitab calcule le R carré pas à pas de K ensembles lorsque la méthode de sélection pas à pas est la sélection ascendante avec validation et lorsque la méthode de validation est la validation croisée de K ensembles. Minitab effectue la sélection ascendante K fois, en omettant les données pour chaque ensemble une fois. Le modèle pour chaque ensemble peut être différent. Une fois les procédures de sélection ascendante terminées, Minitab additionne les erreurs carrées pour tous les ensembles à chaque étape. Minitab utilise cette somme pour calculer le R carré pas à pas de K partitions. Pour la régression :

et pour la régression pondérée :

Ensuite, la formule suivante donne la valeur de R2 pas à pas de K ensembles pour une étape.

Notation

TermeDescription
nombre de lignes sans valeurs manquantes pour la réponse ou valeurs manquantes pour les prédicteurs qui forment les termes candidats dans le modèle
Ie valeur de réponse observée dans la partition j
ie valeur ajustée à validation croisée pour la réponse dans la partition j
Knombre de partitions
wijpondération pour la ie observation dans la partition j
SomCartotalesomme totale des carrés pour toutes les données

Log de vraisemblance

Pour les analyses non pondérées, Minitab utilise l'équation suivante :
Pour une analyse où les observations sont pondérées, Minitab utilise l'équation suivante :

Les observations dont la pondération est de 0 ne sont pas dans l'analyse.

Notation

TermeDescription
nnombre d'observations
Rsomme des carrés de l'erreur pour le modèle
wipondération pour l'ie observation

AICc (critère d'information d'Akaike corrigé)

La valeur AICc n'est pas calculée quand .

Notation

TermeDescription
nnombre d'observations
pnombre de coefficients dans le modèle, constante incluse

BIC (critère d'information bayésien)

Notation

TermeDescription
pnombre de coefficients dans le modèle, constante incluse
nnombre d'observations

Cp de Mallows

Notation

TermeDescription
SCEpsomme des carrés de l'erreur pour le modèle examiné
CMEmcarré moyen de l'erreur pour le modèle incluant tous les termes candidats
nnombre d'observations
pnombre de termes dans le modèle, constante incluse