Méthodes et formules pour les statistiques d'adéquation de l'ajustement pour la fonction Analyser une réponse binaire pour un plan de criblage définitif

Somme des carrés d'écart

La somme des carrés d’écart mesure la différence entre le modèle actuel et le modèle complet. Le modèle complet est celui qui a n paramètres, soit un paramètre par observation. Il maximise la fonction de log de vraisemblance. Il fournit un point de comparaison pour les modèles ayant moins de n paramètres. Les comparaisons avec le modèle complet utilisent la somme des carrés d’écart mise à l'échelle.
L'équation suivante définit la contribution à la somme des carrés d’écart mise à l'échelle pour le modèle binomial :

Les degrés de liberté du test dépendent de l'effectif d'échantillon et du nombre de termes dans le modèle :

Notation

TermeDescription
Lf log de vraisemblance pour le modèle complet
Lclog de vraisemblance du modèle avec un sous-ensemble de termes issus du modèle complet
yi nombre d'événements pour la ie ligne de données
réponse moyenne estimée pour la ie ligne de données
 minombre d'essais pour la ie ligne des données
nnombre de lignes dans les données
pdegrés de liberté de la régression

Pearson

La statistique du Khi deux de Pearson généralisée évalue la différence relative entre les valeurs observées et les valeurs ajustées.

Les degrés de liberté du test dépendent de l'effectif d'échantillon et du nombre de termes dans le modèle. La statistique de Pearson a une loi du Khi deux exacte pour les données normales. Pour les données non normales, comme la loi binomiale ou la loi de Poisson, la statistique se rapproche asymptotiquement de la loi.

Notation

TermeDescription
n nombre de lignes dans les données
pdegrés de liberté de la régression
yi valeur de la réponse pour la ie combinaison de facteurs/covariables
réponse moyenne estimée de la ie ligne
V(·)fonction de variance du modèle, définie ci-dessous
L'équation suivante définit la fonction de la variance pour un modèle binomial :

Hosmer-Lemeshow

Test d'adéquation de l'ajustement pour les modèles avec réponses binaires fondé sur le groupement de données sur la base des probabilités estimées. Il s'agit de la statistique du Khi deux issue d'un tableau 2 x g des fréquences prévues estimées et observées, où g est le nombre de groupes. Le nombre de degrés de liberté du test est égal à g − 2.

La formule est :

Pour former les groupes, Minitab classe les probabilités estimées dans l'ordre, puis tente de créer 10 groupes de taille égale.

Le nombre d'événements prévu dans un groupe est égal à :

événements prévus =

La valeur prévue pour le nombre de non-événements est égal à :

non-événements prévus =

Notation

TermeDescription
nombre d'essais dans le ke groupe
oknombre d'événements parmi les combinaisons de facteurs/covariables
probabilité estimée moyenne pour chaque groupe
πiprobabilités ajustées pour les combinaisons de facteurs/covariables dans un groupe