Méthodes et formules pour les statistiques d'adéquation de l'ajustement pour la fonction Analyser une réponse binaire pour un plan de criblage définitif

Sur ce thème

Somme des carrés d'écart
Pearson
Hosmer-Lemeshow

Somme des carrés d'écart

La somme des carrés d’écart mesure la différence entre le modèle actuel et le modèle complet. Le modèle complet est celui qui a n paramètres, soit un paramètre par observation. Il maximise la fonction de log de vraisemblance. Il fournit un point de comparaison pour les modèles ayant moins de n paramètres. Les comparaisons avec le modèle complet utilisent la somme des carrés d’écart mise à l'échelle.

L'équation suivante définit la contribution à la somme des carrés d’écart mise à l'échelle pour le modèle binomial :

Les degrés de liberté du test dépendent de l'effectif d'échantillon et du nombre de termes dans le modèle :

Notation

Terme	Description
L_f	log de vraisemblance pour le modèle complet
L_c	log de vraisemblance du modèle avec un sous-ensemble de termes issus du modèle complet
y_i	nombre d'événements pour la i^e ligne de données
	réponse moyenne estimée pour la i^e ligne de données
m_i	nombre d'essais pour la i^e ligne des données
n	nombre de lignes dans les données
p	degrés de liberté de la régression

Pearson

La statistique du Khi deux de Pearson généralisée évalue la différence relative entre les valeurs observées et les valeurs ajustées.

Les degrés de liberté du test dépendent de l'effectif d'échantillon et du nombre de termes dans le modèle. La statistique de Pearson a une loi du Khi deux exacte pour les données normales. Pour les données non normales, comme la loi binomiale ou la loi de Poisson, la statistique se rapproche asymptotiquement de la loi.

Notation

Terme	Description
n	nombre de lignes dans les données
p	degrés de liberté de la régression
y_i	valeur de la réponse pour la i^e combinaison de facteurs/covariables
	réponse moyenne estimée de la i^e ligne
V(·)	fonction de variance du modèle, définie ci-dessous

L'équation suivante définit la fonction de la variance pour un modèle binomial :

Hosmer-Lemeshow

Test d'adéquation de l'ajustement pour les modèles avec réponses binaires fondé sur le groupement de données sur la base des probabilités estimées. Il s'agit de la statistique du Khi deux issue d'un tableau 2 x g des fréquences prévues estimées et observées, où g est le nombre de groupes. Le nombre de degrés de liberté du test est égal à g − 2.

La formule est :

Pour former les groupes, Minitab classe les probabilités estimées dans l'ordre, puis tente de créer 10 groupes de taille égale.

Le nombre d'événements prévu dans un groupe est égal à :

événements prévus =

La valeur prévue pour le nombre de non-événements est égal à :

non-événements prévus =

Notation

Terme	Description
	nombre d'essais dans le k^e groupe
o_k	nombre d'événements parmi les combinaisons de facteurs/covariables
	probabilité estimée moyenne pour chaque groupe
π_i	probabilités ajustées pour les combinaisons de facteurs/covariables dans un groupe