Test de Wald | |||
---|---|---|---|
Source | DL | Khi deux | Valeur de P |
Régression | 1 | 7,83 | 0,005 |
Dose (mg) | 1 | 7,83 | 0,005 |
Terme | Coeff | Coef ErT | Valeur de Z | Valeur de p | FIV |
---|---|---|---|---|---|
Constante | -5,25 | 1,99 | -2,64 | 0,008 | |
Dose (mg) | 3,63 | 1,30 | 2,80 | 0,005 | 1,00 |
Dans ces résultats, le dosage est statistiquement significatif au seuil de signification de 0,05. Vous pouvez conclure que la variation du dosage entraîne une variation de la probabilité que l'événement se produise.
Etudiez le coefficient pour déterminer si la variation d'une variable de prévision augmente ou réduit la probabilité d'occurrence de l'événement. La relation entre le coefficient et la probabilité dépend de plusieurs aspects de l'analyse, notamment la fonction de liaison. Généralement, des coefficients positifs indiquent que l'événement devient plus probable quand la valeur du prédicteur augmente. Des coefficients négatifs indiquent que l'événement devient moins probable quand la valeur du prédicteur diminue. Pour plus d'informations, reportez-vous à la rubrique Coefficients et équation de régression pour Ajuster le modèle logistique binaire et Regressão Logística Binária.
Le coefficient pour Dose est de 3,63, ce qui suggère que des dosages plus élevés sont associés à de plus grandes probabilités que l'événement se produira.
Si un terme d'interaction est statistiquement significatif, la relation entre un prédicteur et la réponse diffère selon le niveau de l'autre prédicteur. Dans ce cas, vous ne devez pas interpréter les effets principaux sans prendre en compte l'effet d'interaction. Pour mieux comprendre les effets principaux, les effets d'interaction et la courbure de votre modèle, reportez-vous aux rubriques Diagrammes factoriels et Optimisation des réponses.
Les rapports de probabilités de succès supérieurs à 1 indiquent que l'événement est plus susceptible de se produire à mesure que le prédicteur augmente. Les rapports de probabilités de succès inférieurs à 1 indiquent que l'événement est moins susceptible de se produire à mesure que le prédicteur augmente.
Incrément | Rapport des probabilités de succès | IC à 95 % | |
---|---|---|---|
Dose (mg) | 0,5 | 6,1279 | (1,7218; 21,8087) |
Dans ces résultats, le modèle utilise le dosage d'un médicament pour prévoir la présence ou l'absence de bactérie chez des sujets adultes. Dans cet exemple, l'absence de bactérie constitue l'événement. Chaque comprimé contenant une dose de 0,5 mg, les chercheurs utilisent une variation d'unité de 0,5 mg. Le rapport des probabilités de succès est environ de 6. Pour chaque comprimé supplémentaire pris par un adulte, les probabilités de succès concernant le fait qu'un patient n'ait pas la bactérie sont multipliées par 6.
Pour les prédicteurs de catégorie, le rapport des probabilités de succès compare les probabilités qu'un événement se produise à deux niveaux différents du prédicteur. Minitab configure la comparaison en répertoriant les niveaux dans deux colonnes, Niveau A et Niveau B. Le niveau B est le niveau de référence du facteur. Les rapports des probabilités de succès supérieurs à 1 indiquent que l'événement est plus susceptible de se produire au niveau A. Les rapports des probabilités de succès inférieurs à 1 indiquent que l'événement est moins susceptible de se produire au niveau A. Pour plus d'informations sur le codage des prédicteurs de catégorie, reportez-vous à la rubrique Schémas de codage des prédicteurs de catégorie.
Niveau A | Niveau B | Rapport des probabilités de succès | IC à 95 % |
---|---|---|---|
Mois | |||
2 | 1 | 1,1250 | (0,0600; 21,0834) |
3 | 1 | 3,3750 | (0,2897; 39,3165) |
4 | 1 | 7,7143 | (0,7461; 79,7592) |
5 | 1 | 2,2500 | (0,1107; 45,7172) |
6 | 1 | 6,0000 | (0,5322; 67,6397) |
3 | 2 | 3,0000 | (0,2547; 35,3325) |
4 | 2 | 6,8571 | (0,6556; 71,7169) |
5 | 2 | 2,0000 | (0,0976; 41,0019) |
6 | 2 | 5,3333 | (0,4679; 60,7946) |
4 | 3 | 2,2857 | (0,4103; 12,7323) |
5 | 3 | 0,6667 | (0,0514; 8,6389) |
6 | 3 | 1,7778 | (0,2842; 11,1200) |
5 | 4 | 0,2917 | (0,0252; 3,3719) |
6 | 4 | 0,7778 | (0,1464; 4,1326) |
6 | 5 | 2,6667 | (0,2124; 33,4861) |
Dans ces résultats, le prédicteur de catégorie est le premier mois de la haute saison d'un hôtel. La réponse correspond à l'annulation ou non d'une réservation par un client. Dans cet exemple, une annulation constitue l'événement. Le plus grand rapport des probabilités de succès est d'environ 7,71, lorsque le niveau A est le mois 4 et le niveau B est le mois 1. Cela indique que la probabilité qu'un client annule une réservation pendant le mois 4 est environ 8 fois supérieure à la probabilité qu'un client annule une réservation pendant le mois 1.
Pour plus d'informations, reportez-vous à la rubrique Odds Ratios pour Ajuster le modèle logistique binaire et Regressão Logística Binária.
Pour déterminer l'ajustement du modèle aux données, étudiez les statistiques dans le tableau Récapitulatif du modèle.
De nombreuses statistiques récapitulatives du modèle et d'adéquation de l'ajustement sont influencées par la façon dont les données sont organisées dans la feuille de travail et par le nombre d'essais contenus dans chaque ligne (un ou plusieurs). Le test de Hosmer-Lemeshow n'est pas influencé par le format des données et ses résultats sont comparables quel que soit le format. Pour plus d'informations, accédez à Influence du format des données sur l'ajustement dans la régression logistique binaire.
Plus le R2 de la somme des carrés des écarts est élevé, plus le modèle est ajusté à vos données. Le R2 de la somme des carrés des écarts est toujours compris entre 0 et 100 %.
Le R2 de la somme des carrés des écarts augmente toujours lorsque vous ajoutez des prédicteurs à un modèle. Par exemple, le meilleur modèle à 5 prédicteurs aura toujours une valeur R2 au moins aussi élevée que celle du meilleur modèle à 4 prédicteurs. Par conséquent, le R2 de la somme des carrés des écarts est surtout utile pour comparer des modèles de même taille.
Pour la régression logistique binaire, le format des données a un impact sur le R2 de la somme des carrés des écarts. Celui-ci est généralement plus élevé pour les données qui sont au format événement/essai. Les R2 de la somme des carrés des écarts sont comparables uniquement entre des modèles qui utilisent le même format de données.
Les statistiques d'adéquation de l'ajustement ne sont qu'un des types de mesures permettant d'évaluer l'ajustement du modèle. Même si un modèle présente une valeur souhaitée, vous devez consulter les graphiques des valeurs résiduelles et les tests d'adéquation de l'ajustement pour évaluer l'ajustement du modèle aux données.
Pour comparer des modèles n'ayant pas le même nombre de prédicteurs, utilisez le R2 ajusté de la somme des carrés des écarts. Celui-ci augmente toujours lorsque vous ajoutez un prédicteur au modèle. Le R2 ajusté de la somme des carrés des écarts intègre le nombre de prédicteurs dans le modèle pour vous aider à choisir le modèle correct.
Utilisez les valeurs AIC, AICc et BIC pour comparer différents modèles. Des valeurs faibles sont souhaitables pour chacune. Cependant, le modèle présentant la valeur la plus faible pour un ensemble de prédicteurs n'est pas forcément bien ajusté aux données. Vous devez aussi utiliser les graphiques des valeurs résiduelles et les tests d'adéquation de l'ajustement pour évaluer l'ajustement du modèle aux données.
La zone située sous les valeurs de la courbe ROC varie de 0,5 à 1. Lorsque le modèle binaire peut parfaitement séparer les classes, la zone située sous la courbe est de 1. Lorsque le modèle binaire ne peut pas séparer les classes plus efficacement qu’une affectation aléatoire, la zone située sous la courbe est de 0,5.
R carré de la somme des carrés des écarts | R carré (ajust) de la somme des carrés des écarts | AIC | AICc | BIC | Zone située sous la courbe ROC |
---|---|---|---|---|---|
96,04% | 91,81% | 10,63 | 14,63 | 10,22 | 0,9398 |
Dans ces résultats, le modèle explique 96,04 % de la somme des carrés des écarts dans la variable de réponse. Pour ces données, la valeur R2 de la somme des carrés des écarts indique que le modèle fournit un ajustement correct aux données. La zone située sous la courbe ROC est de 0,9398. Cette valeur indique que le modèle classe correctement une grande partie des données. Si des modèles supplémentaires sont ajustés avec d'autres prédicteurs, utilisez la valeur R2 ajustée de la somme des carrés des écarts, les valeurs AIC, AICc et BIC, ainsi que la zone située sous la courbe ROC pour comparer l'ajustement des modèles aux données.
Si l'écart est statistiquement significatif, vous pouvez essayer une autre fonction de liaison ou modifier les termes du modèle.
Pour la régression logistique binaire, le format des données a un impact sur la valeur de p car il modifie le nombre d'essais par ligne.
Variable | Valeur | Dénombrement | Nom d'événement |
---|---|---|---|
Evénement | Evénement | 160 | Evénement |
Non-événement | 340 | ||
Essai | Total | 500 |
Test | DL | Khi deux | Valeur de p |
---|---|---|---|
Somme des carrés des écarts | 2 | 3,78 | 0,151 |
Pearson | 2 | 3,76 | 0,152 |
Hosmer-Lemeshow | 3 | 3,76 | 0,288 |
Dans ces résultats, le tableau des informations de réponse indique Evénement et Essai dans la colonne Variable. Ces libellés indiquent que les données sont au format événement/essai. Tous les tests d'adéquation de l'ajustement ont des valeurs de p supérieures au seuil de signification habituel de 0,05. Les tests ne permettent pas de conclure que les probabilités prévues diffèrent des probabilités observées d'une façon non prévue par la loi binomiale.
Variable | Valeur | Dénombrement | |
---|---|---|---|
Y | Evénement | 160 | (Evénement) |
Non-événement | 340 | ||
Total | 500 |
Test | DL | Khi deux | Valeur de p |
---|---|---|---|
Somme des carrés des écarts | 497 | 552,03 | 0,044 |
Pearson | 497 | 504,42 | 0,399 |
Hosmer-Lemeshow | 3 | 3,76 | 0,288 |
Dans ces résultats pour les mêmes données, le tableau des informations de réponse affiche Y dans la colonne Variable. Ce libellé indique que les données sont au format réponse binaire/effectif. Le test de la somme des carrés d'écart a une valeur de p inférieure au seuil de signification habituel de 0,05, mais le test de Hosmer-Lemeshow est le plus fiable. Le test de Hosmer-Lemeshow ne permet pas de conclure que les probabilités prévues diffèrent des probabilités observées d'une façon non prévue par la loi binomiale.
Les tracés de contours superposés sont disponibles lorsque vous ajustez un modèle dans le Stat menu.