Méthodes dans Ajuster le modèle logistique binaire et Regressão Linear

Sélectionnez la méthode ou la formule de votre choix.

Combinaison de facteurs/covariables

Décrit un ensemble unique de valeurs de facteurs/covariables dans un fichier de données. Minitab calcule les probabilités d'événements, les valeurs résiduelles et d'autres mesures de diagnostic pour chaque combinaison de facteurs/covariables.

Par exemple, si un fichier de données inclut des facteurs relatifs au sexe et à l'origine ethnique et la covariable relative à l'âge, la combinaison de ces prédicteurs peut contenir autant de combinaisons de covariables que de sujets. Si un fichier de données inclut uniquement les facteurs relatifs au sexe et à l'origine ethnique, les deux étant codés à deux niveaux, il existe seulement quatre combinaisons de facteurs/covariables possibles. Si vous saisissez les données comme des effectifs (ou des réussites, des essais ou des échecs), chaque ligne contient une combinaison de facteurs/covariables.

Pondérations internes pour Ajuster le modèle logistique binaire

Pour les modèles linéaires généralisés, la matrice de pondération n’est pas la matrice d’identité dans les cas où vous ne spécifiez pas de pondérations. On peut considérer que les pondérations internes donnent plus d’influence aux observations avec plus de données sur l’analyse. Par exemple, dans la régression logistique binaire d’ajustement, la pondération interne tend à être plus grande lorsque le nombre d’essais est plus élevé.

Formule

Les formules suivantes donnent les pondérations internes pour des fonctions de liaison spécifiques :
Logit
Normit
Gompit

Notation

TermeDescription
mithe number of trials for the ie row
the predicted probability for the design point in a binary logistic model
yithe number of events for the ie row
the inverse cumulative distribution function of the standard normal distribution for the predicted probability in a binary logistic model

Procédure pour supprimer des prédicteurs fortement corrélés de l'équation de régression dans Ajuster le modèle logistique binaire

Supposons que rij est l'élément dans la matrice de balayage associé à Xi et Xj.

Les variables sont saisies ou supprimées une à une. Xk est éligible à la saisie s'il est une variable indépendante ne se trouvant pas actuellement dans le modèle avec rkk ≥ 1 (tolérance avec une valeur par défaut de 0,0001) et également pour chaque variable Xj se trouvant actuellement dans le modèle,

Pour supprimer des prédicteurs fortement corrélés d'une équation de régression, Minitab suit les étapes suivantes :
  1. Minitab exécute la méthode SWEEP sur la matrice de corrélation, R, traitant X1 … Xp comme s'il s'agissait de variables aléatoires.
  2. Pour tout prédicteur continu, Minitab compare l'élément rkk avec la tolérance ; rkk ≥ tolérance, où k = 1 par rapport à p.
  3. Pour chaque variable Xj se trouvant actuellement dans le modèle, Minitab vérifie que (rjj – rjk * (rkj / rkk)) * tolérance ≤ 1.
    Remarque

    Où rkk, rjk, rjj sont les éléments de diagonale et hors diagonale correspondant aux variables Xj et Xk après l'étape k des opérations SWEEP.

  4. Dans le cas contraire, le prédicteur échoue au test et est supprimé du modèle.
    Remarque

    La valeur de tolérance par défaut est de 8,8e-12.

Remarque

Vous pouvez utiliser la sous-commande TOLERANCE avec la session de commande GZLM pour forcer Minitab à conserver dans le modèle un prédicteur fortement corrélé à un autre prédicteur. Cependant, diminuer la tolérance peut s'avérer dangereux, car cela peut générer des résultats imprécis sur le plan numérique.