Sélectionnez les options pour Ajuster le modèle logistique binaire et Regressão Logística Binária

Stat > Régression > Régression logistique binaire > Ajuster le modèle logistique binaire > Options

Module d'analyse prédictive > Régression logistique binaire > Options

Pondérations

Dans la zone Pondérations, entrez une colonne numérique de pondérations pour pouvoir effectuer une régression pondérée. Les pondérations doivent être supérieures ou égales à zéro. La colonne des pondérations et celle des réponses doivent avoir le même nombre de lignes. Pour plus d'informations sur la manière de déterminer la pondération appropriée, reportez-vous à la rubrique Régression pondérée.

Niveau de confiance pour tous les intervalles

Entrez le niveau de confiance des intervalles pour les coefficients et les valeurs ajustées. Si vous utilisez la fonction de liaison logit, ce niveau de confiance est également celui des intervalles de confiance pour les rapports de probabilités de succès.

Un niveau de confiance de 95 % est généralement efficace. Un niveau de confiance de 95 % indique que, sur 100 échantillons pris parmi la population, l'intervalle de confiance d'environ 95 de ces échantillons contiendra le paramètre estimé par l'intervalle. Pour un fichier de données spécifique, un niveau de confiance inférieur produit un intervalle moins large et un niveau de confiance supérieur produit un intervalle plus large.

Remarque

Pour afficher les intervalles de confiance pour les coefficients et les valeurs ajustées, vous devez accéder à la boîte de dialogue Résultats, puis, dans Affichage des résultats, sélectionner Tableaux développés.

Type d'intervalle de confiance

Vous pouvez sélectionner un intervalle bilatéral ou une borne unilatérale. Pour un même niveau de confiance, une borne est plus proche de l'estimation ponctuelle que l'intervalle. La borne supérieure ne fournit pas de valeur inférieure probable. La borne inférieure ne fournit pas de valeur supérieure probable.
Bilatéral
Utilisez un intervalle de confiance bilatéral pour estimer les valeurs inférieure et supérieure probables pour la probabilité de l'événement.
Borne inférieure
Utilisez une borne de confiance inférieure pour estimer une valeur inférieure probable pour la probabilité de l'événement.
Borne supérieure
Utilisez la borne supérieure de l'intervalle de confiance pour estimer une valeur supérieure possible pour la probabilité de l'événement.

Valeurs résiduelles pour les diagnostics

Les valeurs résiduelles de la somme des carrés d'écart et de Pearson permettent d'identifier des combinaisons dans les diagrammes de valeurs résiduelles et des valeurs aberrantes. Les observations qui sont mal ajustées par le modèle ont des valeurs résiduelles de Pearson et de somme des carrés d'écart élevées. Minitab calcule des valeurs résiduelles pour chaque combinaison distincte de facteurs/covariables.
  • Somme des carrés des écarts : les valeurs résiduelles de la somme des carrés d'écart mesurent le degré de prévision de l'observation par le modèle. Elles sont souvent favorisées pour la régression logistique qui utilise la fonction de liaison logit, car la répartition des valeurs résiduelles est plus proche de la répartition des valeurs résiduelles dans les modèles des moindres carrés. La fonction de liaison logit est la fonction de liaison la plus fréquente.
  • Pearson : les valeurs résiduelles de Pearson mesurent également le degré de prévision de l'observation par le modèle. Une approche commune pour identifier les valeurs aberrantes consiste à tracer les valeurs résiduelles de Pearson en fonction de l'ordre des observations dans la feuille de travail.

Test pour le tableau ANOVA

Sélectionnez le test pour le tableau ANOVA.
  • Test de Wald : le test de Wald par défaut fonctionne bien dans la majorité des cas.
  • Test de rapport de vraisemblance : utilisez cette option si vous préférez le test de rapport de vraisemblance.
Type de somme des carrés des écarts
Sélectionnez une somme des carrés des écarts pour le calcul des valeurs du Khi deux et des valeurs de p. Il est plus courant d'utiliser la somme des carrés des écarts ajustée. Utilisez la somme des carrés d'écart séquentielle pour déterminer la signification des termes en fonction de leur ordre de saisie dans le modèle.
  • Ajustées (Type III) : mesure la réduction de la somme des carrés d'écart pour chaque terme lié à un modèle contenant tous les termes restants.
  • Séquentielles (Type I) : mesure la réduction de la somme des carrés d'écart lorsqu'un terme est ajouté à un modèle contenant uniquement les termes situés avant ce dernier.

Nombre de groupes pour le test de Hosmer-Lemeshow

Entrez le nombre de groupes pour le test de Hosmer-Lemeshow. Si vous n'indiquez pas de valeur ici, Minitab tente de créer 10 groupes de taille égale. Cette valeur de dix groupes fonctionne bien pour la plupart des fichiers de données.

Le test de Hosmer-Lemeshow est un test d'adéquation de l'ajustement qui évalue l'ajustement du modèle en comparant les espérances mathématiques des effectifs aux effectifs observés. Le test divise les données en groupes d'après leurs probabilités estimées, de la plus petite à la plus grande, puis effectue un test du Khi deux pour déterminer si les effectifs observés et prévus sont significativement différents. Si le nombre de schémas facteur/covariable uniques est faible ou élevé, il est conseillé de changer le nombre de groupes. Par exemple, vous pouvez utiliser moins de groupes pour augmenter les valeurs prévues au sein des groupes. Vous pouvez également utiliser plus de groupes pour bénéficier d'un meilleur niveau de détail lors de la comparaison des valeurs observées et prévues. Hosmer et Lemeshow suggèrent d'utiliser un minimum de 6 groupes1.

1 D.W. Hosmer et S. Lemeshow (2000), Applied Logistic Regression, 2e éd. John Wiley & Sons, Inc.